人机交互新进展:LFR-DFSMN语音识别声学模型介绍

  1. 云栖社区>
  2. 达摩院语音实验室>
  3. 博客>
  4. 正文

人机交互新进展:LFR-DFSMN语音识别声学模型介绍

tramp_zsl 2017-10-20 14:45:35 浏览6589
展开阅读全文

语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了语音识别的迭代速度、识别成本、服务质量的全面提升。

一、语音识别背景介绍  

语音识别技术一直都是人机交互技术的重要组成部分。有了语音识别技术,机器就可以像人类一样听懂说话,进而能够思考、理解和反馈。近几年随着深度学习技术的使用,基于深度神经网络的语音识别系统性能获得了极大的提升,开始走向实用化。基于语音识别的语音输入、语音转写、语音检索和语音翻译等技术得到了广泛的应用。阿里巴巴iDST智能语音交互团队一直以来也致力于语音识别技术的研究,同时

网友评论

登录后评论
0/500
评论
tramp_zsl
+ 关注
所属云栖号: 达摩院语音实验室