谷歌开发离线版Google Now 但准确度略有降低

简介:

谷歌正在开发一种即便在离线状态下也能在智能手机上使用的语音识别系统。

谷歌已经在准确度不受影响的前提下缩减了语音库的规模,让该系统能够在处理器和内存资源均比较有限的智能手机上运行。

随着Google Now和Cortana等语音识别系统变得越来越成熟,智能手机用户在出行或者驾车时也可以更迅捷地与他们的移动设备互动。

但是Google Now和Cortana都需要连接互联网,如果没有可靠的网络和数据计划,它们就无法使用。

安装在智能手机上的应用只是连接谷歌、苹果或微软服务器上运行的语音服务的一个接口。这些语音识别系统的工作原理是:智能手机先将用户语音数据收集起来,然后通过互联网发送到服务器上进行处理和分析,一段时间之后服务器会将处理结果发会智能手机并让手机做出相应的反应。

用于分析用户语音的算法极其复杂,不可能在手机有限的硬件上运行。如果能够精简服务器需要处理的数据,整个过程的速度就会加快,这样就会让整个系统的速度加快,同时节省手机上占用的存储空间。这就会让整个语音识别过程更加流畅,但是不管怎样,手机连网仍是一个不可缺少的条件。

谷歌已经开发出一种全新的解决方案。它在研究论文中解释说,它可以将语音识别算法压缩到能够安装到一部智能手机之中的程度,它不但可以有效运行而且不会消耗大量的计算能力。

这个新版本的Google Now语音分析系统比现在公司服务器上运行的系统小10倍。

谷歌已经在Google Nexus 5上测试了这个新版本语音分析系统,使用速度比连网的原版Google Now快7倍。新版本系统已经能够识别从谷歌搜索中提炼出来的300万个匿名语音样本。

研究员们发现,新版本语音识别系统的出错率为13.5%,比连网版Google Now的出错率高出5个百分点。虽然还有待改进,但是这样的结果足以证明这个设计是可行的,这说明智能手机很快就能承担起自行处理语音指令的工作。

在不远的将来,这两个版本的语音识别系统可能会合二为一,整合各自的优势。如果能够将离线版语音识别算法加入Android系统,那么智能手机用户即便在无法连网时也能使用语言识别功能,只是准确度会稍微降低一些。

这样,在办公室或者家中的时候,用户可以选择使用传统的连网版Google Now,而在没有稳定网络的环境下,则可使用离线版Google Now。

研究论文中描述的离线版Google Now具备了连网版Google Now的所有功能,除了字典被精简和准确度有所降低之外,它的功能与连网版Google Now完全一样,比如它也能提供语音定制和错误检测功能。

虽然离线版Google Now尚未正式推出,但是预计它将在未来的某个时候出现在Android平台上。



本文转自d1net(转载)

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
7月前
|
自然语言处理 JavaScript
vue3-ts-vite:Google 多语言调试 / 网页中插入谷歌翻译元素 / 翻译
vue3-ts-vite:Google 多语言调试 / 网页中插入谷歌翻译元素 / 翻译
86 0
|
7月前
|
传感器 安全 Android开发
Google发布 Android 12 开发预览版
Google发布 Android 12 开发预览版
85 1
|
4月前
|
JavaScript 测试技术
【sgGoogleTranslate】自定义组件:基于Vue.js用谷歌Google Translate翻译插件实现网站多国语言开发
【sgGoogleTranslate】自定义组件:基于Vue.js用谷歌Google Translate翻译插件实现网站多国语言开发
|
2月前
|
JavaScript 前端开发 API
谷歌google bard vs chatgpt给我的最大感受,速度真快,注册简单,多种答案提供。。。
谷歌google bard vs chatgpt给我的最大感受,速度真快,注册简单,多种答案提供。。。
18 0
|
10月前
|
中间件 Linux PHP
谷歌二次验证 Google Authenticator
谷歌二次验证 Google Authenticator
136 0
|
11月前
|
机器学习/深度学习 人工智能 算法
合并DeepMind和Google Brain,谷歌迎来AI新时代
合并DeepMind和Google Brain,谷歌迎来AI新时代
合并DeepMind和Google Brain,谷歌迎来AI新时代
|
11月前
|
机器学习/深度学习 数据采集 自然语言处理
谷歌为1000+「长尾」语言创建机器翻译系统,Google翻译已支持部分小众语言
谷歌为1000+「长尾」语言创建机器翻译系统,Google翻译已支持部分小众语言
|
Java API Maven
Guava:google公司开发的一款Java类库扩展工具包
Guava:google公司开发的一款Java类库扩展工具包
335 0
|
算法 搜索推荐 机器人
Google关键词排名多久做上去?谷歌新网站多久能有排名?
关于优质英文外链建设方面,其实我们知道你们是有想法的,知道要做英文外链,可不知道怎么做,做多少量
233 0
Google关键词排名多久做上去?谷歌新网站多久能有排名?
|
算法 搜索推荐 SEO
2023年谷歌搜索排名规则揭秘,Google排名机制
也许流量不会很多,就几个点击,但也足以让谷歌判断你的内容是否满足用户的需求。
279 0
2023年谷歌搜索排名规则揭秘,Google排名机制

热门文章

最新文章