20171105 工作报告

原本计划周日来公司,完成些工作。 却因为搜了一下国内的语音识别岗位,心情有些许低落。没有心情继续工作,随便写点什么。只写给自己,但应该不涉及隐私,遂不加密码。

4-17入职,到现在已经半年了,目前的进度如下

1 使用thrax定制grammar,使用openfst辅助修改G.fst

2 完成一个naive information extraction system,分别写了python和java两个版本

3 熟悉公司内部的decoder 代码,具体的说是 特征提取(MFCC),WFST合成,Viterbi,prune , 以上功能的实现。看过的代码,目前为止掌握程度大概在60-70%左右。从整个语音识别的项目来考虑,掌握程度可能不足30%,甚至20%

4 熟悉WFST compilation的步骤 和 里面涉及的trick。 这个掌握程度目前也就是5%-10%

5 评估了50份左右的简历,旁观面试了10个左右的人。

总结:除了声学模型以外,语音识别后端的内容都接触了一下。应该能够更有效的计划之后的学习和职业发展。

 

针对当下所做的事情,例数不足:

1 心态过于安逸,前期学习劲头足,中期懈怠,目前有抬头的趋势。但因为需要掌握的内容过多,看不清什么时候能够结束学习阶段,开始产出。

2 公司规模小,模型也并不与当下最流行的一致。完成工作已经是有难度了,更不要提拓展自己的技术水平 和 视野。

针对看到的国内语音识别岗位的要求,例数不足:

1 普遍提到的DNN,RNN,只有理论上的掌握和课堂上的作业,缺乏实际经验

2 没有博士学位,以及学术前沿的掌握不能

3 数据结构与算法,没有系统学习过,无法对自己的状态进行评估。应该水平很低

4 python 或者C++ ,任意一门都无法评估自己为精通。阅读代码水平中上,写代码水平最高为中。

除工作需要之外的,可以实现的内容:

1 动手实现kaldi的一个语音框架的搭建,再与工作中的性能进行比较。再从比较中,找到兴趣点,展开学术发展的研究。目的在于产出自己对于某一环节的理解,甚至贡献。(11月底-12月初开始)

2 参加一个数据结构与算法课程,以便于提高自己的代码水平和认知(coursera上的课程,数据结构与算法套餐,6个课程,前5个课程,每个课程1个月的时间完成,最后一个课程未知)

 

 

2 thoughts on “20171105 工作报告

  1. 之前在语音识别上层做过一些工作,只对语言模型有过接触。现在打算进军语音识别领域,希望共勉,共进步。

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.