1. 聚能聊>
  2. 话题详情

阿里云AI收银员上岗,点34杯咖啡只要49秒,你会更喜欢AI吗?

我不确定顾客是否会更喜欢收银AI,但是咖啡师肯定会。因为他们有更多的时间精心为顾客煮上一杯好咖啡了。

“点34杯咖啡,人工需要两分半,而AI收银员只需要49秒”。在今日举办的“云栖大会·武汉峰会”上,阿里云展示了AI点餐技术。客户以每秒5个字的速度,向一台机器点单,并频繁更换语句,这台机器对每次对话均作出了精准应答。

视频中可以看到,点单环节包含了修改、删除、加单等多轮对话,背后是公共场所强噪声环境下的信号处理和语音识别、流式多意图口语理解引擎、多模态人机交互等技术模块的综合使用。

值得一提的是,在整个交流过程中,没有出现”hi,点单机“之类呆板的唤醒词,可直接下单,这也更符合人与人的自然对话。

image

阿里巴巴语音交互首席科学家鄢志杰表示,如今机器对人类口语的理解能力带到了新的高度,这完全打破了”语音唤醒+语音指令”传统命令式交互方式,阿里云首创的流式多意图口语理解引擎,极大地提升了对人类随意、自然的口语表达的理解力,“这些模块并非简单级联,而是深度融合而形成了多模态语音交互方案。现在这套解决方案已经在阿里云上开放,开发者开箱即用”。

这项解决方案除了可以做收银员之外,还能在地铁卖票。目前,上海地铁已经部署了这一技术。乘客直接说出目的地,售票机便可选择合适的站点和路线。测试数据显示,普通买票耗时往往超过30秒,而语音购票全程只需要10秒左右。

那么问题又来了:
1、人工收银员和AI收银员,你更喜欢哪款?为什么?

2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?

3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?

4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?

参与话题

奖品区域 活动规则 已 结束

  • 奖品一

    阿里云代金券 x 4

  • 奖品二

    手机话费 x 2

  • 奖品三

    定制保温杯 x 1

14个回答

1

海阔天空yy 已获得手机话费 复制链接去分享

1、人工收银员和AI收银员,你更喜欢哪款?为什么?
目前没用过AI,可能更相信的还是人工收银员,比较感兴趣的是AI收银员
人工收银员:有人参与感觉更可靠,
AI收银员:新兴事物,目前只是感兴趣,如果AI的好处大于人工的话,相信会喜欢的。

2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
微信上的语音输入转文字用过,识别度还是不错的

3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?
能够从语言逻辑中识别出人们真正想表达的意图,还有能够和大数据集成通过人们表达的意思,分析人们潜在的需求

4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?
应该会的,新东西我都会喜欢尝试一下

0

aoteman675 已获得阿里云代金券 复制链接去分享

1、人工收银员和AI收银员,你更喜欢哪款?为什么?
前台的话选择人工收银员啦,前台的小姐姐交互性更强,留住用户的几率更大些,当然就要分行业了。如果是自助服务类的当然会AI更好,处理速度和时间快,办理速度高。服务行业更注重体验,感觉人工靠谱先,毕竟机器还没有达到人的思维逻辑形态,实际服务需求要复杂的多。
2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
聊天的时候用,语音转文字,适合所有年龄段用户,目前家电智能化转型没有跟上,智能音箱的的作用没有发挥出来,用来听歌比较多。
3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?
识别语音带有的情感色彩,比如一句话可能包含多种含义, 还需要结合当前环境做判断。就算是省略了唤醒词,也要判断是否是本人唤醒,还要结合当前环境判断是否需要唤醒机器协助。比如说一句话,要识别出是人与人的交流还是人与机器的交流。
4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?
开放个实验用用呗,当然开放个平台能自定义更好了。自定义符合本行业的语音产品。

0

微wx笑 已获得阿里云代金券 复制链接去分享

1、人工收银员和AI收银员,你更喜欢哪款?为什么?
感觉自己离科技产品好远,都还木有用过。
语音交互的话AI理解力达到人类水平那肯定是选AI的啊!

2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
语音输入转文字输出

3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?
语音识别方面存在的一个问题就是公开场合的隐私性,有些方面码字的方式更合适。
很多自助服务方面之前是触屏交互,现在都可以根据实际情况考虑加入语音交互。

4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?
目前试过的语音输入转文字输出方面的都不是很理想,考虑试一下多模态语音交互方案。

0

dongdongfu 已获得手机话费 复制链接去分享

1、人工收银员和AI收银员,你更喜欢哪款?为什么?
肯定喜欢坐在收银台前边的小姐姐啊,咋地不比AI养眼?慢一点就慢一点,这样不就能多看几眼了么,有人不是因为收银的小姐姐好看就整天光顾某家咖啡厅?换了AI,效率提高了,要客流量减少的问题,哈哈哈
2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
语音输入转文字,这个我老妈他们用的多,地铁购票上班族用得多(悲惨)
3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?
唤醒词省略了,下一步就应该到监控和识别人的情感或者动作,比如说,检测到人“缺水”就发出提醒需要喝水,检测到工作时间长就发出提醒,或者吃饭时间到了,自动订餐,然后提醒,是否确认等等,好多可以发展的地方
4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?
直接用阿里云提供现成的,然后结合到产品,比如整个什么AI客服小姐姐

0

八面道君 已获得定制保温杯 复制链接去分享

1、人工收银员和AI收银员,你更喜欢哪款?为什么?
人工和AI各有千秋吧,但是我更喜欢AI收银员,因为效率高,不需要等待很长时间 而且还可以节省自己的时间 不需要费劲和人工去重复过多的语句
2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
手机语言助手啦,语言音箱啦,不是因为它智能只是觉得很有趣
3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?
还是情感的交互,比如说假设一个场景 就是你自己刚刚失恋然后心情又不是太好,然后你偶然的进入了一家咖啡店,用着忧虑的心情去审视着整个世界,然后在点东西的时候和点餐员有语言的交互,你们能够通过简单的沟通就能够进行情感的交流,就能够了解对方的爱好,而且也许通过对对方的印象,留个QQ啥的,最后也你们可以做个很好的朋友。这个就是情感交互 是AI做不到的 AI虽然能够在工作中能够胜过人类,但是那只是工作且是简单的工作 人类的智慧是无法模仿的 所以说人工智能应该往情感交互的方向来,让它更像人类
4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?
如果有机会的话,我觉得还是可以尝试一下制作一些简单的语言识别产品的
----ps:想要保温杯· 谢谢 - -

0

沙漠的热情 已获得阿里云代金券 复制链接去分享

1、人工收银员和AI收银员,你更喜欢哪款?为什么?
一个代表现在一个代表未来,不管喜不喜欢都要接受啊!

2、你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
智能音箱(天猫精灵)、智能手表都有问答功能,挺好玩的,大多常识性的问题都能回答的很好。
许多的手机app都有语音转文字,文字转语音的功能。

3、唤醒词都省了,语音识别技术又上了一个台阶,你觉得语音识别方面,还有哪些发展空间?
免了唤醒词还是方便许多的,多轮对话每次都要唤醒挺烦人的。
还有哪些发展空间?就我浅薄的认知提两点吧:
一 专业领域,比如法律、医疗等,它能回答一些普遍的复杂的问题。
二 情感交互,它能理解感受人的情绪,情感陪护也很不错。

4、多模态语音交互方案已经在阿里云上开放,开箱即用,你会去尝试下做点自己的语音识别产品吗?
哦,是嘛,可以去了解下。只是头脑里并没有一个有创意的好点子。

0

1383729944970167 复制链接去分享

当然,A1是明天的新宠

0

东直门右转 复制链接去分享

感觉一觉醒来,什么都变了?跟不上时代的步伐了。

0

1604711395405298 复制链接去分享

你平时都使用了哪些语音识别功能?比如语音转账、语音输入转文字输出、地铁购票、语音控制音箱?
我用的最多的还是语音转化文字,但是感觉用时间久了后,会很累,而且还会有噪音影响。

0

踏雪断蓝桥 复制链接去分享

我觉得只要不是太呆板,当然还是AI好啦,不过我也喜欢小姐姐

0

1685022998168069 复制链接去分享

那霍金说的话......

0

我是路人丙 复制链接去分享

0

小小的棒槌 复制链接去分享

科技改变生活,未来就是玩科技的,加油,努力。