阿里小蜜:语音识别、语义分析、深度学习在手机淘宝的实战分享

简介: 人工智能技术发展了近60年,道路起伏,成果丰硕。还记得2015年《谭铁牛院士:把握得当,人工智能是天使,魔鬼不会出现》的分析与展望。今年一场人机围棋大战,让人工智能彻底热了起来。 学术界,产业界,研究学者,篇篇精彩。业内都期待了解阿里的人工智能技术的实践。我们特别邀请阿里技术专家空无分享下手机淘宝客


【编者按】 人工智能技术发展了近60年,道路起伏,成果丰硕。还记得2015年《谭铁牛院士:把握得当,人工智能是天使,魔鬼不会出现》的分析与展望。今年一场人机围棋大战,让人工智能彻底热了起来。 学术界,产业界,研究学者,篇篇精彩。业内都期待了解阿里的人工智能技术的实践。我们特别邀请阿里技术专家空无来深入分享下手机淘宝客户端是如何用语音识别、语义分析、深度学习等AI技术打造阿里小蜜客服系统的。


下为正文:

 


一场人机大战,让全世界所有对人工智能一知半解的人们变成了人类未来的担忧者、段子手。

“人机大战”占据着公众的眼球,但人工智能的价值已并不局限于“人机大战”的全民话题中。事实上,人工智能已经大量融入到我们的日常生活中,并深刻地影响和改变着我们。

目前,人工智能已开始进入实际商用市场,不仅在硅谷,BAT也已经开始深度实践。比如在语音识别领域,人工智能正在改变服务行业。

 

谈到客服,人们很容易把“接电话”与之划上等号;而在9年以前,大多数人也认为手机只能接电话和发短信。那么未来5年,人们会怎么样理解“客服”?

 

业务场景促使阿里客服智能化


作为全球最大的电商平台,阿里巴巴面对的是逾4亿的活跃消费者、上千万的活跃商家、几千种阿里自有产品和业务,以及每天上千万笔的交易。

 

据天下网商杂志报道,在淘宝和天猫,每天有近5万次热线电话求助。而无线端的在线服务量更是惊人,每天都超过100万次,而且这一数字还在快速增长。特别是今天,年轻人更习惯通过手机,用在线交互的方式寻求帮助。

 

阿里集团业务的复杂性和一直高速增长的成交量,使得客服人员编制越来越“臃肿”。面对爆炸式增长的客户需求,如果仅仅是通过增加客服人数和提升人工效率,显然不是长久之计。更何况阿里也不愿意成为一家“以客服人员为主”的互联网公司。

 

显而易见,阿里已成为世界上客户服务最复杂的公司之一,因此客服智能化是其可持续发展的必由之路。

 

 

 “One-Click”和“One-Stop”的服务体验如何实现?

 

仅仅让用户打电话接通、交易纠纷被处理,是远远不够的,不管是消费者还是商家需要的都是一个“一触即达”的体验。淘宝天猫有着天然的交易闭环,也有极其丰富的数据和先进的基础架构,如何用技术来实现用户的“One-Click”和“One-Stop”的服务体验?
 
2015年开始,阿里巴巴在手机淘宝客户端推出了新一代智能客服产品——阿里小蜜,基于语音识别、语义理解、个性化推荐、深度学习等人工智能技术的应用。在每天应对百万级服务量的情况下,智能解决率达到了接近80%(该指标高于行业智能客服产品平均水平60%以上),甚至在部分重点场景上已经达到95%的智能解决率,服务领域里人机对话语义意图的精确匹配率提升到了93%,满意度比传统的自助服务提升了一倍。

与苹果Siri和微软小冰相比,小蜜背后藏着阿里巴巴人工智能上的新思考。人工智能的最大用处是与真人深度交互,也就是尽可能地模仿真人的思维方式为真人服务,为了达到这一目的,背后需要大量的数据和场景进行支撑。阿里巴巴每天都在产生海量的交易,每次交易带来的用户咨询都在让小蜜变得更智能,未来商业化也将十分可期。
 

智能客服到智能助理,小蜜还可以做更多

 

通过积累的大数据优势,提前分析、预测消费者的服务诉求,主动触达用户,阿里小蜜将用户转电话及在线人工服务的求助率降低了70%。在双十一的消费者咨询高峰,服务团队的算法工程师们可以通过对海量问题的分析和预测,在业内首次将知识库的自动更新时效提升至分钟级,并实时预测每一个用户可能遇到的问题,在用户尚未发起咨询前主动发送精准服务信息,大大降低了用户的困扰。
 
区别于传统的基于自定义知识库的问答型智能客服产品,阿里小蜜真正采用人工智能+知识图谱的方式,支持上下文理解的多轮对话,以及个性化记忆功能,同时机器人每天都会学习几百万条人工的服务记录以及海量的知识源,自动改善智能解决能力。为了让小蜜在对话时能够实时理解用户的问题,小蜜的背后还有一群语音识别领域的科学家,采用目前世界上最先进的BLSTM算法,实现了双向长短时记忆神经网络,突破了传统算法只能从左到右处理数据的瓶颈,能够同时双向识别。并且借助阿里云强大的云计算能力,首次实现了BLSTM算法的大规模企业级部署,有效解决了双向识别带来的延时问题。语音识别正确率在原有基础上显著提升,特别是对重口音用户、语速很快的用户,以及嘈杂环境使用时,改进效果特别显著。 
阿里小蜜已经从智能客服产品发展成为智能助理,类似于Apple Siri、微软小娜等机器人。阿里小蜜也可以和用户像伙伴一样调侃聊天,它既可以帮助用户解决棘手问题,也可以帮助用户完成充值、查天气、订机票、订电影票、买鲜花等服务,因为人工智能技术的深度应用,客服从后端走向前端,帮助业务提升用户体验。

蜂槽代表的智能决策系统

未来,阿里小蜜还会尝试帮助用户解决“38节送什么礼物?智能电视应该怎么选择?周末去哪里旅行?”之类的购物决策方面的问题。

 

当智能机器人服务成熟了以后,阿里还会开放给平台上经营的商家使用。商家能够通过简单的配置为消费者提供专属、便捷的服务。很多小卖家,就不需要24小时守在电脑前了,很多简单的咨询问题,阿里的智能机器人就可以帮助解答。
 
基于体验优先的原则机器解决不了问题的时候,小蜜的智能路由能够将问题无缝的流转到对应的人工服务。

在人工服务的客服工作台,为了根本上提升效率和用户的体验,阿里巴巴客户体验事业群的技术研发团队正在研发一个叫做“蜂槽”的智能对话辅助系统。蜂槽会分析用户在进入客服之前的每一个行为,充分结合用户状态、订单信息,动态分析客户和客服之间的每一句对话,在客服的输入框中10毫秒之内实时推荐精准的回答,客服只需要做选择和修改即可,这样在线客服的工作效率可以获得很大程度提升。通过“蜂槽”不断扩展的智能插件,即使用户突然问出“今天天气如何?BABA股价如何?”,客服也可以不跳出系统,秒级回答用户的问题。


客服与用户的对话记录会成为机器学习的原始数据,用来优化这个智能对话辅助系统,用户的会话习惯、客服的个性风格在积累一段时间后,也会被“蜂槽”学习到,使之变得更加准确和个性化,用户不再感受到冰冷的标准回答。
 
比咨询复杂得多的是交易纠纷处理。淘宝、天猫是一个电商交易平台,海量买家和卖家在这个平台上发生交易,偶尔也可能遇到问题,严重的话会发生争执。买卖双方一旦出现纠纷,阿里的客服就会出来解决问题、化解纠纷。

在最复杂的售后交易纠纷处理领域,阿里巴巴的数据科学家们也发起了对客服领域“最后一座堡垒”的冲击,一个内部代号为“瓦力”的秘密项目也已经开始。由于交易纠纷涉及到买家、卖家、物流三方的不同诉求,在争端发起时,高达50多个纠纷判决因素使这个工作的难度变得非常复杂。过去只有最专业的客服小二经过长时间的训练才能准确做好纠纷判决,机器算法始终不敢碰触这个需要大脑缜密计算和复杂操作的领域,但是随着智能技术的演进、精细行为的可数据化,将算法部署在大型分布式计算集群5分钟之内就可以学习上百万的判决案例。经过持续的优化校准,让机器像人一样去做复杂纠纷的准确判决将会成为现实。
 
注重沟通和智慧的现代客服领域,渠道+CRM+人工客服的模式将发生改变。通过移动和物联网技术,服务的触点从单一的电话变得无所不在、随时随地,以用户为中心、体验驱动的立体服务模式开始构建,基于语音识别、语义理解等技术的智能语音对话让服务的能力和边界都获得很大的延展。同时不需要基于特定设备,服务变得可以和商业紧密相连,客服也被彻底重新定义。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
2月前
|
缓存 Kubernetes 网络协议
阿里云DNS常见问题之在手机上使用阿里的私人dns失败如何解决
阿里云DNS(Domain Name System)服务是一个高可用和可扩展的云端DNS服务,用于将域名转换为IP地址,从而让用户能够通过域名访问云端资源。以下是一些关于阿里云DNS服务的常见问题合集:
|
4月前
|
人工智能 达摩院 并行计算
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,最重要的是,FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能,也就是说,它不仅可以实现语音转写,还能在转写后进行标注,一石二鸟。
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
|
5月前
|
XML Java Android开发
Android Studio开发之使用内容组件Content获取通讯信息讲解及实战(附源码 包括添加手机联系人和发短信)
Android Studio开发之使用内容组件Content获取通讯信息讲解及实战(附源码 包括添加手机联系人和发短信)
99 0
|
10月前
|
移动开发 JavaScript 前端开发
数据可视化大屏百度地图手机端标注开发实战案例解析(jsAPI接口、标注分类图片、文本标签、分类筛选、自适应高度信息弹窗、PHP后端API)
数据可视化大屏百度地图手机端标注开发实战案例解析(jsAPI接口、标注分类图片、文本标签、分类筛选、自适应高度信息弹窗、PHP后端API)
147 0
|
5月前
|
Android开发 网络架构
【Android App】检查手机连接WiFi信息以及扫描周围WiFi的讲解及实战(附源码和演示 超详细必看)
【Android App】检查手机连接WiFi信息以及扫描周围WiFi的讲解及实战(附源码和演示 超详细必看)
234 1
|
5月前
|
XML Java 定位技术
【Android App】定位导航GPS中开启手机定位功能讲解及实战(附源码和演示 超详细)
【Android App】定位导航GPS中开启手机定位功能讲解及实战(附源码和演示 超详细)
121 0
|
5月前
|
XML Java Android开发
Android App开发手机阅读中实现平滑翻书效果和卷曲翻书动画实战(附源码 简单易懂 可直接使用)
Android App开发手机阅读中实现平滑翻书效果和卷曲翻书动画实战(附源码 简单易懂 可直接使用)
88 0

热门文章

最新文章