横评:五款免费开源的语音识别工具

  1. 云栖社区>
  2. 雷锋网>
  3. 博客>
  4. 正文

横评:五款免费开源的语音识别工具

玄学酱 2017-08-02 14:21:00 浏览2389
展开阅读全文

作为 SVDS 研究团队的成员,我们会经常接触各种不同的语音识别技术,也差不多见证了语音识别技术近几年的发展。直到几年之前,最先进的语音技术方案大多都是以语音为基础的(phonetic-based),包括发音模型(Pronunciation models),声学模型(Acoustic Modelling)和语言模型(Language Model)等。通常情况下,这些模型大多都是以隐马尔可夫模型(HMM)和 N-gram 模型为核心的。未来,我们希望以这些传统模型为基础,探索一些诸如与百度 Deep Speech 等最新的语音识别系统相结合的新技术。当然,目前互联网上可以找到许多针对这些基础模型进行解释、汇总的文章和资料,但针对它们之间的差别和特点展开阐述的却并不多。

为此,我们对比了五款基于 HMM 和 N-gram 模型的语音识别

网友评论

登录后评论
0/500
评论
玄学酱
+ 关注
所属云栖号: 雷锋网