AI收银员来了!用华少的语速点30多杯咖啡,49秒搞定!

简介:

“五个巧克力、两个香草拿铁,巧克力加奶油。”

“两个中杯焦糖拿铁,一个热的一个冷的。”

”算了巧克力不要了。”

“再要六个小杯少冰摩卡,三杯加焦糖三杯加香草。”

“再加一个大的冷的拿铁,去冰半糖加脱脂奶,打包。”

5月23日云栖大会武汉峰会上,阿里巴巴达摩院机器智能技术实验室语音交互首席科学家鄢志杰最快以每秒5个字的语速在一台机器前狂点了30多杯咖啡。

与这台机器一同接受挑战的,是一位资深咖啡师。当咖啡师因“语速太快、记不下来”在中途选择放弃时,这台机器却在每一轮对话中都做出了精准响应,并且在49秒时下单成功。

咖啡师在听了鄢志杰第二次复述后,用了2分37秒完成订单。

“今天,我们将机器对人类口语的理解能力带到了新的高度”,鄢志杰说,这种交互方式完全打破了“语音唤醒+语音指令”的传统命令式交互方式。

上述点单环节包含了修改、删除、加单等多轮对话,在整个交流过程中,鄢志杰没有说”hi,点单机“之类呆板的唤醒词,而是直接下单。

鄢志杰介绍,这是由于这台机器中嵌入了多模态语音交互方案,包括公共场所强噪声环境下的信号处理和语音识别、视频识别与面部识别、场景感知等多模态融合的感知智能,同时,融合了流式对话、多轮多意图口语理解、业务知识图谱自适应等认知智能。

“我们首创的流式多意图口语理解引擎,极大地提升了对人类随意、自然的口语表达的理解力,能够做到免唤醒的、自然的人机交流式的语音交互。”鄢志杰说。

据了解,阿里云这项解决方案除了可以做收银员之外,还能在地铁站卖票。目前,上海地铁某些站点已经部署了这一技术,乘客可以直接用语音购票。

比如,当乘客走到语音购票机前时,购票机的屏幕会自动切换至购票页面,并显示:请说出您想要前往的地铁站。当乘客说出目的地,售票机会推荐合适的站点和路线。

ff052d8cfe6c92e05fdab34d9374122a5d68df0e

比如,当乘客说“我要去东方明珠”,购票机屏幕下方会显示:建议坐到陆家嘴站,距离东方明珠285米。同时,语音购票机会回答:“一张去陆家嘴站的票,一共4元,您可以扫码支付。”乘客还可以语音设定购票数量,比如说“换成两张”,购票机会自动回复“已换成两张”,乘客拿出手机对准屏幕二维码扫描完成支付后,机器就会出票。

测试数据显示,普通买票耗时往往超过30秒,而语音购票全程只需要10秒左右。对初到上海的乘客来说,语音购票无疑会给他们带来很多便利,因为面对十几条线路、三百多个站点,谁都会懵。

鄢志杰介绍,目前,该套解决方案已经落地的场景还包括车内语音助手、电话智能客服、可免遥控器操作的远场语音电视、可精准区分多人对话的智能麦克风等。

“未来,我们希望实现公众空间里的万物皆能对话。”鄢志杰说。


原文发布时间为:2018-05-23

本文作者:网商君

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1540 0
与世界同行 2017中国人工智能大会有感
|
人工智能 自动驾驶
2019年上半年收集到的中国人工智能发展详情文章
2019年上半年收集到的中国人工智能发展详情文章
|
人工智能 芯片
中国人工智能计划,我来说几句
中国人工智能计划,我来说几句
|
机器学习/深度学习 人工智能 自然语言处理
2022 年中国人工智能行业发展现状与市场规模分析 市场规模超 3000 亿元
人工智能产业是智能产业发展的核心,是其他智能科技产品发展的基础,近年来,中国人工智能产业在政策与技术双重驱动下呈现高速增长态势。
1564 0
2022 年中国人工智能行业发展现状与市场规模分析 市场规模超 3000 亿元
|
数据采集 人工智能 智能设计
Nat. Biotechnol. | 人工智能药物研发在中国蓬勃发展
Nat. Biotechnol. | 人工智能药物研发在中国蓬勃发展
631 0
Nat. Biotechnol. | 人工智能药物研发在中国蓬勃发展
|
机器学习/深度学习 人工智能 监控
中国95后流行色是什么?人工智能给出的答案是它
中国 95 后的流行色是什么?人工智能说是 RGB 值为 22/20/24 的「黑色」。
507 0
中国95后流行色是什么?人工智能给出的答案是它
|
机器学习/深度学习 人工智能 自然语言处理
机器之心选出全球最值得关注的100家人工智能公司(中国27家),同时这是一个开源项目
机器之心和 Comet Labs 联合发布了影响全球人工智能公司的榜单。我们选取了基础研究、技术和产品、行业潜力、公司运营能力、资本实力等五个维度,甄选出了全球范围内最具前途的 100 家人工智能公司,它们包括那些我们已经熟知的科技巨头,垂直行业独角兽,也有尚在萌芽的初创公司。 当然,这份榜单肯定没有做到尽善尽美,也存在 100 家的名额限制,但我们坚信,这份基于我们诚意、内容经验和专业判断的不存在任何商业利益的榜单可以为大家总结和精炼出一些有价值的信息,带给大家灵感和启发。
442 0
机器之心选出全球最值得关注的100家人工智能公司(中国27家),同时这是一个开源项目
|
机器学习/深度学习 人工智能 自然语言处理
AI 2000人工智能全球最具影响力学者揭晓,中国正在快速追赶美国
AI 2000人工智能全球最具影响力学者揭晓,中国正在快速追赶美国
AI 2000人工智能全球最具影响力学者揭晓,中国正在快速追赶美国
|
人工智能 安全 算法
​《2020科技趋势报告》重磅发布:人工智能重塑业务形态,中国创造了新的世界秩序
​《2020科技趋势报告》重磅发布:人工智能重塑业务形态,中国创造了新的世界秩序
​《2020科技趋势报告》重磅发布:人工智能重塑业务形态,中国创造了新的世界秩序