演讲实录丨朱频频 让Bots无处不在

  1. 云栖社区>
  2. 博客>
  3. 正文

演讲实录丨朱频频 让Bots无处不在

沉默术士 2017-05-24 16:25:00 浏览1414
展开阅读全文

让Bots无处不在

朱频频

上海智臻智能网络科技公司、小i机器人总裁兼首席技术官


朱频频:大家好!我也是蠢蠢的科大人。前几天召开世界人工智能大会,下午做了六场演讲,其中四个是科大校友,今天大概也有至少三个科大校友。

    什么叫Bots?小i机器人在2004年就推出首个在MSN上的聊天机器人,在业内叫法就是Bots,其实是Robot非常亲密的称呼,很多时候指的是一款虚拟的机器人,可以生活在网络里面,具有机器人核心思考和交互的部分,但不一定有自己的实体。

    今天是世界机器人大会,看到很多实体机器人,有工业机器人、服务机器人。去年第一届世界机器人大会,当时看到主要还是工业机器人,服务机器人比较少,但今年看到非常丰富多彩的服务机器人。我们对服务机器人和工业机器人的区分,认为服务机器人动作、各方面运动要求可能没有工业机器人那么精准和复杂,但是服务机器人对智能的要求非常高。平常提到智能机器人时,脑袋当中第一印象就是变形金刚、科幻世界当中i-Robot,还有动画片中大白,2014年底有一部科幻片叫《星际穿越》,里面有一款机器人,这才是未来机器人应该具备的一些形态,不一定具备人形。人这种形态在很多动作和操作方面并不是一个最优的状态,很多动物在运动方面能力、感知方面能力比人类强很多,人类最特色的地方在于什么?胡郁总提到计算智能、感知智能、认知智能,人类最特殊得罪人智能就在认知智能部分。

    对于一款完整的智能机器人,我们认为有三个非常重要的要素,也是大家所公认的:感觉、运动、思考。思考相当于智能机器人的大脑,大脑部分就是由认知智能驱动的,认知智能主要做语言、知识、常识方面的工作。

    如果一个智能机器人没有运动部分,也没有外壳,没有其他可以直接感知到的部分,是生活在网络里面,它就是一款虚拟机器人。现在大家称为Bot。

    例,招商银行小招,智能机器人认知职能以及智能交互部分是由小招机器人提供的。我们可以跟它进行智能对话,而且跟招商银行内部系统对接在一起。

    这款虚拟机器人不仅仅是在微信上面,在招行网站上、QQ上、各种移动终端上、传统渠道上,包括电话、营业厅门店,通过一些实体的机器人都可以呈现出来。它的核心部分就是智能交互部分,是由认知智能驱动的。

    有报告,认为智能人机交互方式会在2020年增强移动交互40%以上,开启一个新的时代,后APP时代。现在大家在移动互联网里很多都在用下载的APP,有很多应用将来通过简单的界面就可以承载,而不用做复杂的APP。Bots相对APP来说有很多好处:容易使用,就是一个非常自然的文字或语音,甚至包括图象的交互界面,可以像真人一样跟它对话;相对于APP来说更容易构建,在一些Bots平台支持下,我们可以只关注如何做商业逻辑,而不用关注界面如何设置,用户体验怎么实现起来;易传播,相对APP来说不需要下载,很多时候仅仅添加一个好友,线下扫一个二维码就可以直接添加起来;接口统一,都是用自然语言方式进行交互,所以各种不同的Bots可以很容易联合在一起,一个Bot不懂你在说什么东西,可以问另外一个Bot,把云端很多智能能力联结在一起。

    现在在我们身边有很多Bots,除了小招这种客服机器人之外,还有很多在国际上著名的Bots,比如苹果的Siri。Siri是2007年创业的一家公司,2010年被苹果收购,当时有三个创始人,其中两个创始人离开了苹果,做了一家新公司,直到四年之后,这家新公司才出现,这家新公司叫VIV,据说做出来的智能甩Siri几条街,但真实的产品刚刚出来就已经被三星收购了。三星也要把这种智能人机交互的方式植入到它的手机当中去。

    著名的Google,之前有一款产品跟Siri比较类似,但是这款产品现在已经不在了。还发布了一款新的聊天工具,这款聊天工具最大的特色是两个人在对话,其中一个人发了一个很漂亮的日落图片,在我的交互界面中就会出现三个部分,第一个写很漂亮的日落,所以具备读图的功能,对图片里的场景识别有一些功能;第二个是很漂亮,这些快捷的回复。可以随便点一个快捷回复给你的好友。这个像在应付你的好友,假设你哪天跟你的朋友很好心分享一个图片,结果他在应付你,甚至都没有仔细看是什么样的东西。这个地方完全是虚拟机器人去做,就是一款Bot,里面就是用户跟Bot交互的界面

    有一个很好的定义,什么叫做Bot?其实就是通讯平台当中的一个数字用户,在通讯平台上可能是两个人在交互,如果其中一个是软件,是数字用户,那就是一个Bot。

    微软在Bot方面投入精力非常巨大,微软的小娜非常有名,微软还专门出了一个新的名词,叫做CUI,就是会话的交互界面,其实就是Bot核心交互的能力。

    即时通讯就是一个会话界面,Bot自然而然被嵌入到里面去。大家平常都在用微信,在座恐怕百分之百都在用微信,微信月活跃用户有8亿,移动QQ比它的活跃用户数还要大,但是微信并不是全球最大的IM平台,其中最大的是What’sAPP,Facebook message,还有韩国、日本、台湾非常流行的Line,另外还有其他IM工具。现在几乎全球用户都被IM覆盖掉,即使在经济非常落后的非洲,也被IM覆盖大量的用户,而且这些大的IM平台都已经纷纷引入了Bot这样一些应用。我们认为Bot现在会非常火,会在我们身边,更多应用会用Bot形式向我们展示。

    按照Bot承载的内容和功能目标来分,有几种不同类型的Bot,比如最早期的聊天机器人,像Eliza很早就出现,可以在电脑终端里跟人交互,美国在线的IM,还有在中国最早出现的MSN上的小i机器人,微软的小冰也是一款聊天机器人。

    聊天机器人可能大家觉得比较好玩,但是商业价值暂时还没有,这也是我们小i为什么要转型的原因,后来做客服机器人,商业价值非常明显,只需要教给机器人行业知识、垂直内容,就成为一个行业专家,可以回答很多行业专业的问题,提供客户服务。在全球最大的做客服机器人的厂商就是小i机器人,全国有近千家大型客户。还有比较像Siri的虚拟个人助手,在中国一般叫云助手。还有一类可以主要用语音方式跟它进行交互,比如亚马逊的Echo。这些都是不同的Bots。

    其中客服机器人方面具有非常明确的商业价值,而且也是落地最为广泛的,比较有意思,智能客服机器人在中国的发展比在全球发展要快,在中国的落地比全球落地要更多。其实不仅仅是因为技术的问题,也不仅仅是因为小i努力的问题,更重要的是这个技术在中国和美国发展的阶段不同的问题。IVR技术经过很长发展时间,大家都想办法怎么降低IVR里语音成本,自动语音导航功能很早就实现,降低成本,在国内由于技术发展没有到这个地步,但同时互联网发展的跟美国速度差不多,所以在互联网上智能客服机器人从很大程度上分流对电话的压力,反而在中国VCA发展会更为快捷,而在美国发展的比中国要慢。

    在前几天,美国Gartner在奥兰多举办一个全球峰会,预测2017年十大技术发展趋势,其中一个非常重要的发展趋势就是Bots,可能是后APP时代重要的技术趋势。典型篮球Bots应用,第一个举的就是小i机器人,第二个是Siri,第三个是Cortana,第四个是亚马逊。中国发明所谓“互联网+”、人工智能+”词在美国也被应用。

    小i机器人是2004年1月份在MSN上作为一款聊天机器人出现的,聊天机器人比较好玩,跟你插科打诨,询问天气、股票、地图等服务,我们整合很多服务在里面。虽然当时用户量很大,现在MSN或QQ上大概聚集超过5000万用户,但就是不赚钱,没法赚钱。用户虽然添加你为好友,但并不是持续在使用,包括亚马逊的Echo也是这样的情况,亚马逊虽然卖了上百万,为什么买Echo?因为很便宜,还挺好玩,而且购买亚马逊Echo还赠送音乐在线服务,所以用户花的成本不是很高。但是亚马逊为什么用这么低的价格去卖这个东西呢?是延伸他们服务跟用户之间交互的界面。如果要靠智能硬件去赚钱,这种模式就不一定合适了。当时我们虽然有很多用户,但也没有非常明确的商业模式,在2009年的时候,我们就转型,不再做2C的聊天机器人,做2B的客服机器人,专门回答行业专业性的问题。

    从那时候开始,我们做了很多客服机器人,网页上的客服机器人,可能多一个机器人的LOGO,点击进去就是一个交互界面,有中国移动、招商银行、联想、京东、上海税务局等交互界面,还有在微信上的,这款叫沃mail(音),顺丰叫做丰小满,还有通用和携程的。还有短信上各种应用,以及在QQ上、飞信上、APP上,APP上可以用语音的方式进行交互。

    从线上也可以迁移到线下,核心是大脑部分,我们把机器人交互跟虚拟机器人做了整合。可以在展台上看到,这款本体是韩国的,一款是被日本收购了,还有另外一款是上海机器人公司制造的。

    使用VCA的回报非常明显,建行为例,每年VCA系统可以替代6000名电话座席,每一个座席每年花十几万成本,对于中国建设银行来说也是有巨大的成本的节省,全国前50大银行里面38家采用我们这种智能客服系统,电信运营商以及政府一些客户使用客服系统,还有更多行业都在用。

    目前对于客服机器人来说,VCA我们是全球领先,不然的话Gartner也不会把我们列在第一位。

    小i机器人的核心是做语义理解,语义理解是由知识和语义驱动的,我们已经聚集各行各业里面很多一些知识和语音部分,是通过我们学习体系不断从大数据里面学习得来的,大数据来自于我们的爬虫,来自于客户给我们提供的数据,来自于我们这些系统上线以后不断地去交互的内容。核心语义理解和交互跟语音图象多模态交互方式结合在一起,形成完整的人机交互的模式。在前端,通过企业级、标准级和云服务、操作系统等形式,提供给我们合作伙伴和客户们。

    我们商业模式非常清晰,跟IBM商业模式比较类似,是把人工智能能力提供给我们的客户和合作伙伴们。

    基于深度学习的情感分析模型融入到我们智能对话当中去,我们知识库是小i独创的知识库模型,抽象语义的多维知识库,通过人机协作学习体系不断积累知识。现在覆盖了十多个行业,以及一百多个领域。

    小i机器人不仅仅提供智能客服,针对企业级提供知识、语义、智能语音、智能搜索更多方面的一些智能应用能力。目前不仅仅支持中文,也支持繁体中文和英文,不仅是在实验室的技术,已经有很多客户买单,已经上线了。我们还有iBot Cloud是针对中小客户和开发者提供的,不需要从自然语言底层开始做起,可以用非常简单的方法再去维护他们的知识库。我们不仅提供软件,之所以参加世界机器人大会,很重要的是我们提供一个iBotOS操作系统,可以在云端智能人机交互能力,还有语义理解和认知能力能够提供给这些智能硬件们。

    我们有一款机器人也是由我们iBotOS驱动的,表情也非常负责,给大家演示一下。

    小i机器人有大量的商业应用,这些商业应用产生大量的数据,这些数据通过机器学习的体系,不断产生各行各业的知识和语义,促进我们更多产业应用,现在形成一个正向循环,并且在不断加速。

    谢谢大家!

本文来源于"中国人工智能学会",原文发表时间" 2016-10-23"

网友评论

登录后评论
0/500
评论
沉默术士
+ 关注