IBM将公开语音识别源码 携Avaya拓语音市场

简介:

IBM将于周一宣布向两个源码开放软件组织公开其部分语音识别软件。

此举标明IBM意欲促进语音应用软件开发,是和微软等竞争对手较量中的出奇制胜之招。预计在今后几年内随着客户呼叫中心、汽车电子等的发展,该市场将呈上升趋势。为此,IBM再次亮出其杀手锏:公布部分专署软件源码,以便开发人员改进。

IBM负责软件业务的高级副总Steven A. Mills说:“我们努力推动源码标准,从而开发出越来越多的语音应用软件。我们的源码公开举措是为促使该产业生态形成而迈出的重要一步。这样将会为IBM带来更多的商业机会”

经过数十年的研发,语音识别已经开始逐步进入主流应用。统计建模、模式匹配算法等领域的进展以及处理能力的提高都使得语音识别范围较以前有了长足的提高。

以前语音识别应用软件都是客户化定制的,而如今变成了可重用的标准软件包。现在可以在Web应用程序中加入语音功能,这样程序开发人员就可以使用他们熟悉的工具而无需额外培训。

Opus研究机构分析师Mark Plakias说:“整个语音领域的发展趋势和信息技术业方向一致,语音软件成本应该大幅降低”。

IBM即将公开的语音识别源码是该公司花了大约1000万美元才开发而成的。一系列处理基本日期、时间、地名等的语音软件将交付给Apache软件组织。该公司还打算将其语音编辑工具捐赠给另一家源码开放机构Eclipse组织。

以前IBM就曾向源码开放团体公布过其代码。譬如,在8月份该公司曾向Apache公开了其用Java编写的数据库软件Cloudscape。而且IBM一直对诸如Apache Web服务器及Linux操作系统等源码开放项目鼎立支持。Mills 说:“这是我们一贯做法”。

IBM还将公布同呼叫中心供应商Avaya达成的一项合作协议,双方共同为企业客户开发基于语音的自助应用程序。Avaya通讯应用部副总Eileen Rudden说:“Web自助及语音服务可以同时开发。我们认为这是降低构建语音应用成本的一条有效途径,并且可以进一步拓展市场”。

根据该协议,Avaya计划为IBM的WebSphere提供其呼叫中心软件。然而这并非一个排它性协议。WebSphere是IBM软件战略的核心,它包括构建应用程序所需工具,并且其它软件可以在其平台上运行。

WebSphere是在操作系统之上的一层软件,对微软的Windows及.Net技术构成巨大威胁。

然而,微软也已经开发出了自己的语音识别标准工具,并于3月份发布了具有语音功能的Speech Server 2004。超过10万软件开发人员下载了微软基于.Net技术的免费语音开发工具。

据微软高层宣称,采用该公司技术构建语音应用程序比诸如IBM等其它公司的工具更加便宜和快速。

微软语音技术市场主管James Mastan说:“IBM在步微软后尘,IBM未能像微软一样将公司技术推向更加广阔的市场”。




原文出处:科技行者
转载请与作者联系,同时请务必标明文章原始出处和原文链接及本声明。
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
Java 语音技术 开发工具
Android 讯飞离线语音听写/离线语音识别SDK
Android 讯飞离线语音听写/离线语音识别SDK
391 0
Android 讯飞离线语音听写/离线语音识别SDK
|
4月前
|
JSON 自然语言处理 Java
Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)
Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战(超详细 附源码)
122 0
|
3月前
|
语音技术
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)【1月更文挑战第11天】【1月更文挑战第52篇】
33 1
|
4月前
|
JSON 语音技术 Android开发
【Android App】在线语音识别功能实现(使用云知声平台与WebSocket 超详细 附源码)
【Android App】在线语音识别功能实现(使用云知声平台与WebSocket 超详细 附源码)
35 0
|
4月前
|
XML Java 语音技术
Android App开发在线语音识别处理中实现中文转拼音(Pinyin4j库)功能(超详细 附源码和演示)
Android App开发在线语音识别处理中实现中文转拼音(Pinyin4j库)功能(超详细 附源码和演示)
68 0
|
5月前
|
语音技术
同一个语音为什么识别结果还不一致的,有大佬知道原因吗(Paraformer语音识别-中文-通用-16k-离线-large-热词版)
模型speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404,在线体验同一个语音识别结果不一致(https://modelscope.cn/models/damo/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404/summary)
158 0
|
9月前
|
人工智能 编解码 API
C# 10分钟完成百度语音技术(语音识别与合成)——入门篇
C# 10分钟完成百度语音技术(语音识别与合成)——入门篇
|
9月前
|
自然语言处理 语音技术
STM32工程---非特定语音识别模块使用---语音播报+语音识别
STM32工程---非特定语音识别模块使用---语音播报+语音识别
114 0
|
机器学习/深度学习 传感器 人工智能
【语音识别】基于BP神经网络实现语音特征信号分类附matlab代码
【语音识别】基于BP神经网络实现语音特征信号分类附matlab代码
|
Java 语音技术 开发工具
Android 科大讯飞语音识别(详细步骤+源码)
Android 科大讯飞语音识别(详细步骤+源码)
966 0
Android 科大讯飞语音识别(详细步骤+源码)