避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

简介:

特定场景进行特定培训,这是打造更连贯、更自然的人机语音交互的一个解决途径。

“iPhone的市场占有率是多少?”

—“目前80%。”

“那华为的呢?”

—“怎么都喜欢华为?”

以上是发生在镁客君与某一语音交互机器人之间的对话。

避免沦为人工智障,机器人还需找对语音交互的打开方式

你来我往之间,那些令人“头痛”的瞬间

在日常生活中,通过语音交互技术,我们能够与机器人进行交流,或者是让后者实时控制一些家居产品;在办公时间,借助于语音交互技术,我们也能够直接口头交代语音助理一些工作,从而提升工作效率……

可以说,随着背后语音识别和自然语言处理技术的逐步提升,人们对于“语音交互”这一人机交互方式正在变得渐渐适应。不过,在你来我往的语音对话之间,我们也不可避免的也遇到了一些有时令人“哭笑不得”的BUG。

2017国家服务机器人产业高峰论坛于近日落下帷幕,在圆桌环节的自由问答时间,有人提出一个问题,称当前的服务机器人在人机语音交互的过程中,常常会词不达意,或者是出现上下文不连贯的问题,导致最终的用户体验不佳。可以说,这是当前人机交互上最“头痛”的问题,也是导致人工智能被冠上“人工智障”称号的根本原因。

避免沦为人工智障,机器人还需找对语音交互的打开方式

避免“人工智障”,我们目前需要将机器人关在“笼子”里

谈及这种“人工智障”现象,其中主要涉及自然语言处理和深度神经网络的一个问题。

一般情况下,基于自然语言处理技术,人工智能系统即能够对人们的语句进行拆分和处理,从而做到“理解”这句话,继而对用户作出相应的回应。至于上下文连贯,这其中主要关乎深度神经网络的一个搭建,换一种说法,主要是“知识图谱”在起作用。仍以本文最开始的对话为例:

“iPhone的市场占有率是多少?”

—“目前80%。”

“那华为的呢?”

—“目前是xx%。”

在深度神经网络,或者是知识图谱的协助下,当我们提出第二个问题的时候,它会将华为与上一个问题的“市场占有率”进行关联,从而做到对这一问题更为完整、精准的理解。

事实上,为了达到更为完美、自然的人机交互体验,难道人工智能企业就没有搭建深度神经网络、构造知识图谱吗?当然不是,只不过在这基础之上,依据当前机器人的语音交互的整体情况,我们还需要附加一些场景条件。

这一块问题的解决还是需要根据不同的场景来做不同的定制,毕竟这也不是说一个模型、一个算法就能解决好所有的问题。武汉泰迪智慧科技有限公司创始人兼董事长李成华表示。

总结一下也就是说,要想解决当前这一上下文理解不连贯的问题,我们还需要依据特定的场景来对机器人进行特定的数据训练,从而打造一个特定机器人。举个例子,比如智能客服机器人,其所能提供服务的领域包括金融、教育、酒店等多个领域,每个领域都有着其所特有的问题或是对话场景,为了保证对话的连贯,我们就得利用这些特有数据进行培训,构建一个面向垂直领域的知识图谱,以避免问题交叉、逻辑混乱等情况的出现。

避免沦为人工智障,机器人还需找对语音交互的打开方式

面对无人驾驶的落地问题,我们都说低速行驶、封闭性场景是其当前能够快速实现落地的一个方向,简单粗暴的说,也就是将无人驾驶汽车关在一个相对“封闭”的场景里。而与此类似,要想机器人在语音交互上表现的没有那么“智障”,我们也需要将其关在一个限定的“笼子”里面来实施培训,不同的是,无人驾驶汽车的“笼子”是在真实的物理世界,而机器人则是在一个虚拟层面。


原文发布时间: 2017-09-21 09:32
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
11月前
|
人工智能 自然语言处理 语音技术
ChatGPT充当大脑,指挥AudioGPT解决语音、音乐、音效等任务
ChatGPT充当大脑,指挥AudioGPT解决语音、音乐、音效等任务
|
人工智能 算法 机器人
重现「黑镜」:用「AI机器人」与逝去的亲人实时聊天
最近,微软获得了一项新专利:「人工智能聊天机器人」,它根据逝者在社交平台上发布的内容或其他网络言论来模仿逝者,并与亲人进行「实时聊天」。网友大呼:「黑镜」来了!
253 0
重现「黑镜」:用「AI机器人」与逝去的亲人实时聊天
|
机器学习/深度学习 人工智能 自然语言处理
尖叫连连!这是谷歌I/O带来的新惊喜:智能助手零延迟对话、3D鲨鱼「上舞台」
北京时间 5 月 8 日凌晨,一年一度的谷歌 I/O 大会在加州山景城如期开幕。今年的大会上,除了常规的安卓 Q 版本更新以外,新手机和「家庭智能设备中心」Nest Hub 显得更加引人注目。而去年惊艳的「能和人打电话的 AI」Duplex 也有了新升级。
133 0
尖叫连连!这是谷歌I/O带来的新惊喜:智能助手零延迟对话、3D鲨鱼「上舞台」
|
机器学习/深度学习 人工智能 自然语言处理
现实版「柯南变声器」来了,搜狗变声让你声音随心变
声音秒变志玲姐姐,秒变「矮大紧」,秒变萝莉、正太,现在通通不是问题!
597 0
现实版「柯南变声器」来了,搜狗变声让你声音随心变
|
机器学习/深度学习 人工智能 达摩院
十问科学家 | 关于语音交互,鄢志杰这么说
鄢志杰长期从事语音交互智能的研究、 产品化和商业化工作,在他看来,虽然现在语音 技术在持续进步,但是离解锁下一个关键场景还有很长的距离——技术发展的斜率还不 够陡峭。
486 0
|
传感器 语音技术
智能语音马桶来了:能自动掀盖,还能和你语音对话
智能马桶拥有许多特别的功能:如臀部清净、下身清净、移动清净、坐圈保温、暖风烘干、自动除臭、静音落座等等。最方便的是,除了可以通过按钮面板来进行操作,还**专门设有语音识别**以实现这些功能,消费者在使
智能语音马桶来了:能自动掀盖,还能和你语音对话
|
人工智能 机器人 区块链
7月18日科技联播:意念操控机器人?我们不解码你的动作却能解码你的意图
你有想象过未来的某一天,你可以用意念操控你的手机电脑吗?美国初创公司CTRL-labs给出了答案。大英博物馆入驻天猫,这只猫都火到国外去了;还有哪些大事儿你不知道,科技联播提前为你分享!
1827 0