更高级的 Alexa:你下了指令,它会三思而后行

简介: 最让我们兴奋的一件事就是,我们有了能够实现这种“零触控”的能力。

雷锋网(公众号:雷锋网)按:研究机构 IDC 曾预计,智能家居设备的市场将迎来强劲的增长;2019 年, 智能家居设备出货量将同比增长 26.9%,达到 8.327 亿台;到 2023 年,这一数字将达到 16 亿台。

而根据 Dashbot 之前的一项调查研究显示,他们采访了 1019 名 Amazon Echo 和 Google Home 用户,其中,75% 的受访者每天至少使用一次语音助手,23% 的人用语音助手来控制智能家居设备。

TB1apu_XAY2gK0jSZFgXXc5OFXa.png

为了更好地了解亚马逊在智能家居设备以及在 Alexa 相关方面的工作布局,VentureBeat 采访了 Alexa 用户体验团队的负责人 Nathan Smith,他的团队专注于为 Alexa 设计更好的功能。雷锋网在不改变原意的基础上做了编译。

以下是 VentureBeat 采访 Nathan Smith 的对话实录,雷锋网编译:

问:您可以先从总体上概述一下亚马逊的智能家居和语音交互,然后再详细介绍一下,您的团队为了让 Alexa 更好地管理联网设备,做的什么样的努力呢?

答:当然。我们认为智能家居目前正处于大规模使用和扩展的阶段。现在有超过 60000 种产品和 7400 个不同的制造商与 Alexa 合作,我们可以清楚地看到的这样一个趋势:Alexa 让控制智能家居设备的变得自由。

今年,让我最振奋的是一个新功能,这个功能可以借助机器学习和人工智能来帮助 Alexa 来理解你用户真正的意思,优化用户体验。比如,随着人们越来越多地往家里添置智能设备,他们很有可能会弄混这些设备的名字,所以,我们要做的就是让 Alexa 更像人类。如果用户对 Alexa 发出指令,让 Alexa 打开“Sofa Lights”(沙发灯),但实际上他是希望 Alexa 打开"Living Room Lights"(客厅灯),Alexa 则会建议性地询问,弄明白用户真正的需求。

从某种程度上来说,这项功能让用户在对 Alexa 发出指令时能够更加随意,因为 Alexa 不再严格受制于语法,也不再严格受制于发音,即便是多语言混合使用,Alexa 对其进行分析。实际上,这一切都基于亚马逊试图建立一个能让 Alexa 更理解用户的世界,而不是训练人们适应 Alexa 的工作方式。如果 Alexa 非常清楚用户在说什么,那么,它将简单地执行任务;但我们希望,如果 Alexa 对某件事不是 100% 确定,它能够在模棱两可的环境下有所帮助,而不是直接执行任务。

这项功能将从 12 月底开始在美国推出,然后会扩展到加拿大、澳大利亚、英国和印度。

TB16ri_Xvb2gK0jSZK9XXaEgFXa.jpg

问:Alexa 在决定响应一个命令时,还考虑了哪些其他因素?

答:Alexa 会收集基本事实,并将它们吸收到语义和行为模型中,以一种非常人性化的方式进行学习,就像一个孩子会对世界感到好奇一样;而我们的模型旨在根据设备状态和行为信号,以及环境信号对信号进行分层,然后再生成建议。

除此之外,我们还有很多工作要做,这种工作方式可以扩展到其他场景。我们看到来自各行各业和拥有不同技术背景的客户开始使用支持 Alexa 的智能家居设备,这是利用尖端技术来简化客户体验的第一步。

问:人工智能和机器学习显然是 Alexa 的核心。除了帮助 Alexa 进行语言处理,智能理解指令,正确无误地完成任务,您的团队还在用人工智能解决其他挑战吗,有何进展呢?

答:在功能层面,Alexa 会根据它所连接的传感器或设备上获得的信息来提出建议。当用户对 Alexa 说“晚安”时,Alexa 会检查用户车库的灯是否还亮着,然后在模型中搜寻车库灯平时的开关状态,发现异常后它就会提出建议。比如,“我注意到您车库的灯开着,要不要我帮您关灯?”

我们希望,随着越来越多的用户开始使用 Alexa,我们能够跟上他们的需求,所以,我们使用机器学习等技术来展望未来,并从中学习。

TB1JLy.Xrr1gK0jSZR0XXbP8XXa.jpg

问:就像您刚才说的,智能家居的使用率似乎在上升,这可能有一部分原因是联网设备变得越来越便宜了。您还有哪些方法可以让人们在入住时感到更便捷?

答:我们已经在这方面做了很长时间的努力,其中最让我们兴奋的一件事就是,我们有了能够实现这种“零触控”的能力。去年,我们发布了 Wi-Fi 简易设置,它可以让用户快速配置上亚马逊的智能设备,比如亚马逊智能插头。一般来说,只要用户插上电源,Alexa 就会说,“嘿,我找到你的新设备了。“我们还将同样的体验带到了蓝牙低能耗灯泡上,我们正在努力扩大这项技术的广泛应用。

目录
相关文章
|
1月前
|
人工智能 文字识别 安全
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的SIMA项目旨在创建一个通用AI代理,该代理能在多种3D环境中执行复杂任务,通过语言指令与环境交互。目标是让AI理解并执行600多种动作,包括导航和建造等。使用多样化的3D环境训练,结合零基础训练和预训练模型,如SPARC和Phenaki,以增强语言理解和行动执行。评估方法多角度,包括人类评估,但也面临效率和成本挑战。项目注重伦理安全,但AI在复杂环境中的性能仍有提升空间。DeepMind将继续优化代理的鲁棒性,扩大研究范围,以推动通用人工智能的发展。
21 2
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
|
1月前
|
存储 JavaScript 前端开发
【ChatGPT 指令大全】怎么使用ChatGPT辅助程式开发
【ChatGPT 指令大全】怎么使用ChatGPT辅助程式开发
24 0
|
2月前
|
容器
火山中文编程 -- 挂接事件
火山中文编程 -- 挂接事件
17 0
|
11月前
|
传感器 算法 机器人
将执行器「缝」进衣袖,斯坦福无接触设备,远程传递触摸信息
将执行器「缝」进衣袖,斯坦福无接触设备,远程传递触摸信息
|
Ubuntu Linux Windows
项目实战:Qt终端命令模拟工具 v1.0.0(实时获取命令行输出,执行指令,模拟ctrl+c中止操作)
在Qt软件中实现部分终端控制命令行功能,使软件内可以又好的模拟终端控制,提升软件整体契合度。
项目实战:Qt终端命令模拟工具 v1.0.0(实时获取命令行输出,执行指令,模拟ctrl+c中止操作)
|
Web App开发 自然语言处理 机器人
十行代码即可为你的网站添加语音小助手,无需任何外部依赖
前面一篇文章有讲到通过 Web Speech API 来朗诵诗歌,写了个诗歌朗诵的小网站。 而 Web Speech API 除了语音输出外,还支持语音识别,你可以通过 Web Speech API 收集用户的语音指令,为你的网站添加一些有趣的功能:比如在小说阅读网站上添加语音指令,让你可以语音控制翻书、下一章等,让你可以更方便的一边看小说一边吃薯片。🐶
|
弹性计算 数据安全/隐私保护
使用标签控制云助手的命令执行
简介: 子账号或相关角色只能将云助手命令执行在带有某种标签的ECS实例上,否则执行不成功。
303 0
使用标签控制云助手的命令执行
|
自然语言处理 API UED
谷歌、百度、有道做不到的,统统交给这5款翻译工具!
提到翻译工具,我们首先想到的就是谷歌、有道、百度、必应。这些工具虽然知名,且经过多年的考验和优化。但是,尺有所短、寸有所长,这些主流的翻译工具也有很多明显的不足。
谷歌、百度、有道做不到的,统统交给这5款翻译工具!
|
开发者 智能硬件
我们帮你测试了 Google Home,它会是你想要的完美助手吗?
Google Home 是谷歌在 2016 年 I/O 开发者大会上推出的一款智能硬件产品。时隔一年,Google Home 新增了 5 个特性:全新的通知功能、拨打电话、增加日历和提醒、电视操作界面、支持更多流媒体服务。
227 0
我们帮你测试了 Google Home,它会是你想要的完美助手吗?