Alexa已经疯狂扩张到10000项技能,但断言它是语音交互的未来还太早

简介:

Alexa已经疯狂扩张到10000项技能,但断言它是语音交互的未来还太早

雷锋网消息:亚马逊周四宣布,旗下的Alexa智能语音助手平台已经拥有超过10000项“技能”(Skill)。去年1月,这个数字还只有130,到11月也才刚刚突破5000,因此这个增速相当惊人。

Alexa是预装在亚马逊Echo智能音箱内的虚拟助手,它可以接受各种语音命令,相当于亚马逊版的Siri。在使用Echo的时候,只需要说一声“Alexa”就可以启动它。

2015年6月,亚马逊宣布开放Alexa平台,第三方开发者可以在该平台上开发基于语音的技能。随着第三方的开发者越来越多,Alexa涵盖的技能也越来越广泛,除了查询天气、播放音乐、创建任务、设置闹钟、发送消息之类的基本功能之外,还支持预订外卖、Uber打车、控制家用电器等各种功能。

除了第三方开发者,Alexa也已经对第三方硬件厂商开放。最开始,支持Alexa的硬件只有亚马逊自家的Echo音箱系列,但是现在已经有冰箱、汽车等加入到了支持Alexa的大军。

哪些“技能”最受欢迎?

Alexa已经疯狂扩张到10000项技能,但断言它是语音交互的未来还太早

根据VoiceLab的报告,目前最受欢迎的技能种类主要是新闻、游戏、教育、生活方式等几大类别。以下是Alexa Skills商店最受欢迎榜单中的前十名:

  • "This Day in History"(历史上的今天):通过提问,可以了解到任意日期都发生过哪些著名的历史事件,这个技能的资料都是来自于history.com网站。

  • “Short Bedtime Story ”(睡前小故事):这个技能听起来没什么稀奇,让Siri或者Cortana讲一个小故事也不是什么难事,它的最大特点是能够将故事中主人翁的名字换成小朋友的名字,这对小朋友来说很有吸引力。

  • “Ambient Noise:Thunderstorm, Ocean, and Rain sound”:这其实是三个技能,它们的功能也很简单,就是播放雷暴、海洋和下雨的声音,这些声音可以帮助你保持平静,并且有助于睡眠。

  • “ Jeopardy! J6 ”:“Jeopardy!”(危险边缘)其实是一个智力竞赛节目,这个节目采取一种独特的问答形式,参赛者须根据以答案形式提供的各种线索,以问题的形式作出正确的回答。这个技能由“索尼影视电视”开发,内容的编写也是有节目的编剧完成,可以看做是电视节目的语音版。

  • “Ditty”(小调):这个技能能够将你说的任何话变成一首歌,此外,你还可以选择歌曲节奏的快慢,甚至是歌曲的主题。如果你关联了Twitter的账号的话,还可以将“你的”杰作分享到网上分享。

  • “Twenty Questions”:这个游戏应该很多人都玩过,很多聊天机器人都自带这种功能。启动这个技能之后,它会问你各种问题,并在20个问题之内猜出你心中所想的物体或者任务的名称。

  • “Curiosity”(好奇心):这个技能主打知识分享,从历史到科学,无所不包,特别是有趣的或者脑洞大开的知识。

  • “Inspire Me”(给我一碗鸡汤):想让你的每一天都充满鸡血吗?试试这个技能,因为它会让你的每一天都从名人名言开始。(不过据雷锋网了解,该技能目前还没有收录马云的名言。)

大多数“技能”的实用性较低

问题是,目前Alexa平台已经拥有超过10000项技能,除了排在榜单前列的技能之外,其他技能真的有人在使用吗?

实际上,在亚马逊Alexa Skills商店里,大部分的技能都没有任何评价,而且实用性存疑。比如一个叫“Sensory Organ”(感觉器官)的技能,根据描述,它能教育使用者“人的身体有多少感觉器官”,以及每个器官的名称又是什么,但是不论你问他什么,它都答非所问。

根据CIRP的报告,截至2017年1月,亚马逊Echo系列(包括Echo、EchoDot和Tap)用户已达到820万。随着Echo的使用者越来愈多,Alexa平台越来越壮大,很难不让人把它与早期的App Store相比较。其实早期App Store的畅销榜单上也充斥着各种低质量、或者没有任何实际作用的应用,比如数不清的模拟放屁声音的恶作剧应用。

所有开发者都想抓住这一机遇,结果就是数不清的技能根本就没有考虑过用户的实际需求,大多数人很可能都没听说过,更不要说使用了。

曝光度难题

App Store里目前有数百万的应用,然而除了常年占据榜单前列的头部应用之外,绝大部分应用都面临如何被用户知晓的难题,而Alexa Skills平台的这一问题则更加突出。尽管亚马逊针对Alexa Skills商店做了分类以及过滤等搜索改进,但是就目前来看,Alexa Skills商店仍然显得相当“笨拙”,而这些改进对于提高各种技能的曝光度也没有起到任何作用。

而且,作为不需要使用屏幕的语音交互平台,如何在不打开手机或者电脑的情况下搜索各种应用也是Alexa需要解决的问题。

用户的留存率

此外,用户的留存率也是一个 大问题。根据VoiceLabs的报告,平均而言,一个语音技能在启用一周后仍然会被使用的概率只有3%,主要原因是技能启动的失败率较高。

想要启用一个技能,首先必须记住它的名字,其次还得准确地说出特定的命令语句,这大大提高了用户的使用门槛。而且由于所有的Alexa技能都是基于云端提供服务,当网络不稳定时,很容易造成启动失败或者反应延迟,让用户产生挫败感。

你的手机上可能装载了几十个、甚至上百个应用,虽然其中一些可能不常用,但是你不需要记住它们的名字,需要时可以随时查找。但是如果你启用了几十个Alexa语音技能,你能记住所有技能的名称吗?

开发者如何变现

目前Alexa的开发者大致分为两类。一类是企业,为Alexa开发技能对他们来说有很大的营销价值,而且有助于吸引更多的用户;另一类则是纯粹的爱好者,对他们来说,这不是一份工作,而是一种乐趣。这两类开发者的共同点在于:这些“技能”能否带来收入并不是他们关注的重点。

Forrester Research的分析师James McQuivey表示,“除非Alexa有清晰的变现方式,否则不会真正朝着专业的方向发展。”让开发者能够看到变现的路径是App Store得以快速发展的根基,即使大多数的应用的收入并不高,但是众多成功的例子足以吸引一个高级开发者为此投入资源。

虽然亚马逊表示目前Alexa已经吸引了很多开发者,但是它并没有公布具体的数量。如果亚马逊不能为开发者提供变现路径,那么如何留住他们并吸引更多专业的开发者将是未来必须面对的难题。

总结

在过去的几年里,虽然自然语言处理能力、位置信息服务和大数据分析技术获得了长足的发展,但是要想给Alexa这样的平台打造一款好用的语音技能依然困难重重。而且与App Store相比,Alexa的开发者想要获得收入也是遥遥无期。

语音交互的未来应该是自然的,当你想让知道历史上的今天都发生过哪些著名事件,最自然的应该是“Alexa,告诉我历史上的今天都发生过哪些著名事件”,而不是“Alexa,帮我打开‘This Day in History’”,然后再说“告诉我历史上的今天都发生过哪些著名事件”。

随着亚马逊Echo和Alexa的大获成功,几乎国内外所有IT巨头都相继进入了语音交互市场,包括谷歌、苹果、微软、亚马逊、Facebook、三星、阿里、百度、腾讯、华为、科大讯飞等等,国内也陆续出现了思必驰、云知声、声智科技、三角兽、蓦然、Rokid等创业公司。(详见雷锋网(公众号:雷锋网)文章《Alexa估值近百亿美元,AI巨头为何在语音交互市场抢夺赛道?》)

但是就算是领头羊亚马逊,目前也存在诸多问题。语音交互的未来应该是怎样一种形态?这个问题值得所有从业者思考。

本文作者:周翔

本文转自雷锋网禁止二次转载,原文链接

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
2月前
|
人工智能 搜索推荐 机器人
基于大模型的语音交互音响将会上市销售
基于大模型的语音交互音响将会上市销售
43 6
基于大模型的语音交互音响将会上市销售
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
基于大模型思维链(Chain-of-Thought)技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用
基于大模型思维链(Chain-of-Thought)技术的定制化思维链提示和定向刺激提示的心理咨询场景定向ai智能应用
|
10月前
|
人工智能 安全 开发者
AI辅助软件开发:代码自动补全和错误检测
在软件开发的过程中,编写高质量的代码是至关重要的。然而,编写大量的代码并保证其准确性和完整性是一项具有挑战性的任务。幸运的是,现代的软件开发中出现了AI辅助工具,能够提供代码自动补全和错误检测的功能。本文将介绍这些功能的优势,并演示如何使用AI辅助工具来提高开发效率和代码质量。
720 0
|
人工智能 开发框架 供应链
智能AI绘画系统对接丨ai绘画数藏模式系统开发功能版及源码
智能AI绘画系统对接丨ai绘画数藏模式系统开发功能版及源码
368 0
|
自然语言处理 IDE Serverless
【2】天猫精灵开放实验平台实验—创建单轮或多轮天气查询意图
【2】天猫精灵开放实验平台实验—创建单轮或多轮天气查询意图
118 0
【2】天猫精灵开放实验平台实验—创建单轮或多轮天气查询意图
|
机器学习/深度学习 算法
语音直播系统,做好敏感词屏蔽打造绿色社交环境
语音直播系统,做好敏感词屏蔽打造绿色社交环境
|
机器学习/深度学习 人工智能 自然语言处理
使用AI系统 前有五大语音交互需要 你懂得的
本文,具体介绍了下面5大方面的行业实战评价指标:
|
人工智能
|
人工智能 小程序 前端开发
华为主动找我合作,我放弃了!前端实现拍照识别垃圾分类最简单的方法!
2019年7月,上海作为第一个试运行垃圾分类的城市。当时的微信指数居高不下,引发了非常热烈的社会讨论,原因是上海当时执行得很坚决,社区垃圾桶旁都有带着红袖标的大爷大妈在看着,扔错了现场罚200元。 当时人心惶惶,有很多人担心自己分类不准确被罚款。上海市政府在宣传垃圾分类的时候就在推一个垃圾分类查询的小程序。我当时捕捉到了这个热点,花了一天时间使用uni-app快速搭建了一个拍照识别垃圾所属分类的小程序《垃圾分类精灵》(现在还在线,大家可以搜来用)。在短短半个月里获取到了6w多用户。
164 0
华为主动找我合作,我放弃了!前端实现拍照识别垃圾分类最简单的方法!
|
自然语言处理 算法
The second day :天猫精灵玩法之创建意图,实现对话功能
创建意图,让天猫精灵具备一个简单的服务能力。
The second day :天猫精灵玩法之创建意图,实现对话功能