20180329 工作报告

又是将近半年过去了,还有一个月入职就满一年了,再次对自己这一年来的成长做一个总结,以及对未来的发展做一个期望。 目前掌握的技能:(the number in the round bracket means the level of my skill in the related area judged by myself) 1 Customize grammar fst for command and control application in a very short time using thrax.  Fix grammar fst in a low level need using openfst. (95%) Usually the work flow is : ① getting […]

20171105 工作报告

原本计划周日来公司,完成些工作。 却因为搜了一下国内的语音识别岗位,心情有些许低落。没有心情继续工作,随便写点什么。只写给自己,但应该不涉及隐私,遂不加密码。 4-17入职,到现在已经半年了,目前的进度如下 1 使用thrax定制grammar,使用openfst辅助修改G.fst 2 完成一个naive information extraction system,分别写了python和java两个版本 3 熟悉公司内部的decoder 代码,具体的说是 特征提取(MFCC),WFST合成,Viterbi,prune , 以上功能的实现。看过的代码,目前为止掌握程度大概在60-70%左右。从整个语音识别的项目来考虑,掌握程度可能不足30%,甚至20% 4 熟悉WFST compilation的步骤 和 里面涉及的trick。 这个掌握程度目前也就是5%-10% 5 评估了50份左右的简历,旁观面试了10个左右的人。 总结:除了声学模型以外,语音识别后端的内容都接触了一下。应该能够更有效的计划之后的学习和职业发展。   针对当下所做的事情,例数不足: 1 心态过于安逸,前期学习劲头足,中期懈怠,目前有抬头的趋势。但因为需要掌握的内容过多,看不清什么时候能够结束学习阶段,开始产出。 2 公司规模小,模型也并不与当下最流行的一致。完成工作已经是有难度了,更不要提拓展自己的技术水平 和 视野。 针对看到的国内语音识别岗位的要求,例数不足: 1 普遍提到的DNN,RNN,只有理论上的掌握和课堂上的作业,缺乏实际经验 2 没有博士学位,以及学术前沿的掌握不能 3 数据结构与算法,没有系统学习过,无法对自己的状态进行评估。应该水平很低 4 python 或者C++ ,任意一门都无法评估自己为精通。阅读代码水平中上,写代码水平最高为中。 除工作需要之外的,可以实现的内容: 1 动手实现kaldi的一个语音框架的搭建,再与工作中的性能进行比较。再从比较中,找到兴趣点,展开学术发展的研究。目的在于产出自己对于某一环节的理解,甚至贡献。(11月底-12月初开始) 2 参加一个数据结构与算法课程,以便于提高自己的代码水平和认知(coursera上的课程,数据结构与算法套餐,6个课程,前5个课程,每个课程1个月的时间完成,最后一个课程未知)