产品推荐

智能语音交互

基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。

了解更多

图像识别 Image Recognition

基于大数据和深度学习实现,可精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等。

了解更多

自然语言处理

为各类企业及开发者提供的用于文本分析及挖掘的核心工具,已经广泛应用在电商、文化娱乐、金融、物流等行业客户的多项业务中。

了解更多

人脸识别 Face Recognition

实现了图像或视频中人脸的检测、分析和比对,包括人脸检测定位、人脸属性识别和人脸比对等独立服务模块。

了解更多

了解语音交互

17分钟视频短片,带你读懂语音交互技术

InterSpeech 2017直播解读

语音识别技术之自适应技术

2017年10月25日 19:30

点击回顾

语音识别技术语音唤醒技术

2017年11月1日 19:30

点击回顾

语音识别技术之语言模型

2017年11月8日 19:30

点击回顾

语音识别技术语音合成技术

2017年11月15日 19:30

点击回顾

语音识别技术之远场语音识别

2017年11月22日 19:30

点击回顾

语音识别技术之声学模型

2017年11月29日 19:30

点击回顾

语音识别技术之关键词检索

2017年12月06日 19:30

点击回顾

语音识别技术之后处理

2017年12月20日 19:30

点击回顾

视频回顾

语音识别技术之自适应技术

语音识别技术语音唤醒技术

语音识别技术之语言模型

语音识别技术语音合成技术

语音识别技术之远场语音识别

语音识别技术之声学模型

语音识别技术之关键词检索

语音识别技术之后处理

干货文章

语音识别技术之自适应技术

语音识别中的自适应,即针对某一个说话人或者某一domain来优化语音识别系统的识别性能,使得识别系统对他们的性能有一定的提升。

立即查看>>

语音识别技术之语音唤醒技术

目前市场上推出了各式各样的音箱,机器人,车载等语音交互产品,语音识别是交互的入口,而语音唤醒成为了踏进这一入口的第一步,如何高效、准确地对用户指令给出反应成为这一技术的最重要目标。

立即查看>>

语音识别之语言模型技术

语音识别技术,通俗讲叫语音转文字,speech-to-text,是将观测得到的语音输入信号,转化成与之对应的文本序列的过程。

立即查看>>

语音识别之语音合成技术

语音合成技术是将任意文本转换成语音的技术。是人与计算机语音交互必不可少的模块。

立即查看>>

语音识别之远场语音识别技术

远场语音识别是语音交互领域的重要技术,目的在于在远距离条件下(通常1m-10m),让机器能够识别人的语音。

立即查看>>

语音识别技术之声学模型

声学模型是语音识别系统的重要组成部分,它占据着语音识别大部分的计算开销,决定着语音识别系统的性能。

立即查看>>

语音识别之后处理技术

语音识别之后处理技术,主要是优化语音识别产品的用户体验,包括:口语顺滑(Disfluency Detection)、标点恢复(Punctuation Restoration)和逆文本标准化(Inverse Text Normalization)等。

立即查看>>

语音识别技术之关键词检索

语音关键词检索也叫spoken term detection, 或keyword spotting。有别于大家熟知的文本搜索的最大特点是语音关键词检索是对语音文件的搜索。

立即查看>>