1. 云栖社区>
  2. 全部标签>
  3. #语音识别#
语音识别

#语音识别#

已有10人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

语音识别(ASR)基础介绍第三篇——经典做法及术语概念

上一章介绍了万金油特征MFCC,相当于数据的输入已经确定了。 本章尽可能的介绍经典asr做法。其中涉及到的各种概念和思考,了解了之后,和相关专业的人交流,大概就不再迷茫了:D 传统方法也可以按 声学模型 和 语言学模型 的方式来划分。 声学模型主要的职责是,把一段音频处理成类似拼音的形式, 然后交给语言模型来猜: 能够发这些音的单词,怎么组合起来更常见一些。然后找到最可能的组合,便是asr的结

算法 阿里技术协会 语音识别 高斯模型 解决方案 asr 语言模型

语音识别(ASR)基础介绍第四篇——当今流行做法与CTC

本篇开始,就进入到了asr当前的流行做法。 这里单独提到了CTC算法。  这个算法对当前asr使用deep learning的方法有重大影响。 总体感觉,写到本篇,工作量反而变得很小。因为进入deep learning时代后,神经网络模型基本都是那么几种,已经不再需要挨个详细介绍。而且看图就能理解的很明白。 所以本篇后半部分基本就是贴图了。。:D 一、CTC 在CTC之前,训练语料

算法 阿里技术协会 语音识别 序列 asr 神经网络

Python用ctypes调用动态库的方式使用科大讯飞语音识别

ctypes 是 Python 的一个模块,它提供了C语言相关的数据类型,可以方便的调用C语言编写的DLL(Windows 动态链接库)和so(Linux动态链接库)。科大讯飞的语音识别客户端SDK提供了Linux下的C语言SDK,却没有Python的。

linux python 函数 模块 sdk 语音识别 js 数据类型

97
GO