苹果大秀AI肌肉:详解Core ML框架及智能音箱HomePod

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=png&wxfrom=5&wx_lazy=1

“I love machine learning, especially since I’m a machine, learning. ”

—— Siri

与Google相比,今天凌晨的苹果全球开发者大会(WWDC)节奏超快。

苹果一口气连续发布了多款软硬件新产品、新服务。比方各种操作系统,包括iOS 11、macOS High Sierra、watchOS 4;新款iPad Pro;全新的iMac Pro;以及多年以来的又一款新产品:HomePod。

整场WWDC有一个因素贯穿始终,那就是机器学习。长期以来苹果都被认为在人工智能方面进展缓慢,但苹果显然不甘落后。

到底苹果秀了哪些AI肌肉?咱们一个一个说。

CoreML

我们来念一遍WWDC的全称:全球开发者大会(Worldwide Developers Conference)。

在iOS 11更好的Siri、手机上的AR背后,自然是面向开发者的新工具。Core ML就是苹果新推出的,面向开发者的机器学习框架。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

苹果说,Core ML让开发者更容易把机器学习用到App里,文本分析、人脸识别等等功能,都可以依靠这个工具。苹果说,用了Core ML,iPhone上的人脸识别比Google Pixel上快6倍。

Core ML支持所有主要的神经网络:深度神经网络(DNN)、递归神经网络(RNN)、卷积神经网络(CNN),除此之外,它还支持SVM(支持向量机)、以及线性模型和树集成。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在Core ML的支持下,开发者可以把训练完成的机器学习模型,封装进App之中。

苹果强调用户隐私的一贯风格,在Core ML中也有承袭。Core ML让所有的机器学习计算都在iOS设备本地进行。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

除了能支持超过30层的深度学习模型之外,Core ML还支持Tree ensembles,SVM和广义线性模型。

Core ML还能无缝切换于CPU和GPU之间,以提供最强的性能和效率。目前Core ML提供视觉和自然语言两个API。

关于Core ML的更多细节,请访问:

https://developer.apple.com/documentation/coreml

想要获取Core ML开发工具,可以访问如下网址:

https://pypi.python.org/pypi/coremltools

顺便说一句,苹果还为开发者推出了AR开发工具包ARKit。

Siri

640?wx_fmt=png&wxfrom=5&wx_lazy=1

在iOS 11中,Siri得到了一次大升级。

早在上个月,就有传闻称苹果要让Siri支持更多的App,从只能假装陪你聊天、用用iOS的原生功能,到可以操作你手机里安装的App。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

传闻实现了,苹果在WWDC上宣布,Siri支持一系列第三方应用,包括微信,这个功能,叫做Siri Kit。

不过,苹果怎么会被传闻完全说中。

除了支持第三方应用,Siri还有更厉害的招数:更自然的语音、实时翻译、更精准的预测。

苹果负责技术的副总裁Craig Federighi说,“我们用深度学习为Siri打造了更自然、更富有表达力的声音。”

紧接着,他播放了英文版Siri的声音,男声版就讲了本文开头的那个冷笑话。不知道母语者感觉如何,量子位的母语不是英语,听起来,的确感觉与真人差异不大。不过,在后来展示实时翻译的时候,他又让Siri说了一下中文,听起来虽然比现在有很大提升,但终究还是像个机器。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

实时翻译,就是在你用英语问Siri“How do you say … in Chinese?”,Siri就会立刻把你的话翻译成汉字显示在屏幕上,还要用中文给你念一遍。

这个实时翻译功能首先支持英译汉、西、意、法、德。

另外,Siri借助机器学习,还能更了解用户的兴趣,可以据此推荐新闻、帮用户回复消息,或者根据用户在浏览器中完成的订票行为,要求帮用户在日历上添加事件。

HomePod

640?wx_fmt=png&wxfrom=5&wx_lazy=1

对,HomePod就是传说中的苹果智能音箱。售价349美元。

美国、英国、澳大利亚三个国家首发,不过正式发布也要等到今年12月。其他国家和地区要等到明年发售。

这个新产品的发布,不仅仅是苹果全家桶又增了一项,而是再次确认了新趋势的不可阻挡。随着Apple Siri的发布,美国市值最高的三家科技巨头:苹果、Google、亚马逊,全部加入到智能音箱市场的争夺之中。

就在苹果发布会开始前几天,Google宣布Google Home智能音箱将于月底在加拿大发售,并随即启动预售,而且官方还降价促销。不过,最近几天Home也出现了问题,不少用户反馈这个智能音箱失去响应。

基本情况

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

 量子位注:目前Google Home官网打折,从6月4日开始,售价下调至109美元。

HomePod高度约7英寸,底部设有7个环绕喇叭,内置低音炮,整个产品由A8芯片控制,支持实时声音建模。通过芯片,HomePod可以完成声场设置、降噪和语音识别工作,而且还能对空间进行识别调整。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

音质

毕竟是音箱,怎么也得谈谈音质。

在今天的发布会上,苹果大谈HomePod音质如何如何好,不过目前还无法确切得知。因为今天的HomePod只能看,不能摸,而且现场的展品也没有发出声音。

另外两家,Home能提供更丰富的环绕音质,Echo在低音方面有缺陷,但也有人觉得更自然。最近Home升级之后,也能支持蓝牙播放了,在这点上终于追上Echo。这两个设备都支持Pandora、Spotify。

当然区别还是有一些,Echo支持Amazon Music;而Home支持Google Play Musci、YouTube Red;HomePod显然支持Apple Music。

语音控制

智能音箱主要使用语音交互来控制音乐播放、搜索、智能家居等。Echo的唤醒指令比较丰富:Hey Alexa、Alexa、Amazon、Echo、computer都行。而Home的唤醒指令是:OK, Google以及Hey, Google。HomePod肯定要用:Hey Siri。

这些产品都使用了远场语音识别技术,Echo和Home能在15米外识别用户的语音指令。HomePod据说距离更远。

在硬件方面,Amazon Echo使用6+1配置的环形麦克风阵列,而Google Home使用的是双麦克风方案。Echo能更好的对声源方向进行定位。而苹果发布的HomePod使用了6个麦克风进行声音采集。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

虚拟助手

每个智能音箱内部,都住着一个人工智能程序。Echo住的是Alexa,Google Home住的是Google Assistant。HomePod住着Siri。

在使用体验方面,Google Assistant能够从网上获取更多的信息,因而也能更好的回答用户提出的问题,而Alexa更擅长处理购物相关的请求。而关于Siri,目前可以在各位的苹果手机上试验一下。

Google Assistant在语音交互方面更进一步,能够根据前一个问题,继续回答用户的相关追问。毫无疑问,在问答方面Google优势明显。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

苹果发布的信息显示,HomePod目前可以播放音乐、新闻、天气及股票等信息,设置提醒,通报交通和附近的状况,并与HomeKit集成用于控制智能家居设备。

当然,以上所有智能音箱的语音交互都得通过英语完成。

功能扩展

Home目前有200个第三方技能,可以帮助用户从达美乐订购披萨,也能从Uber叫车。但是Echo已经掌握了超过11000个新技能,而且能向Google Calendar添加事件、从Gmail里提取行程细节,这些反而Home都做不到。

Echo可以帮你免费打电话或发短信给任何一个使用Echo设备或Alexa App的用户。而Google Home现在可以给手机打电话了。

Google的产品支持多用户和多房间功能,Home可以辨认最多六位用户的声音,并且能无缝切换不同用户的账号和设置。

而Amazon的用户得跟Echo说“切换账户到某某”才行。Home能在不同的房间同步音频,而Echo现在还不行。

目前HomePod这方面的表现还不得而知。但可以想见,未来正式发售时,Siri一定会有更大幅度的更新,支持这个全新的硬件。

竞争解析

智能音箱这个市场,亚马逊是绝对的先行者。

2014年11月6日,亚马逊面向会员和受邀用户推出了Echo。这款产品于2015年6月23日在美国正式发售。目前,亚马逊共有三款不同型号的Echo系列产品在售。价格从50美元-230美元不等,瞄准不同用户群。

Google扮演了追赶者的角色。2016年5月,Google在I/O大会上正式发布Home。2017年5月的I/O大会上,Home发布了一些新功能。不过目前Google Home仍然只有一款型号在售,但可选择的配色方案更丰富。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

来自eMarketer的报告显示,智能音箱市场Amazon Echo一家独大,占据70%的市场份额,Google Home的份额为23%。其余所有人分享5%。现在苹果也杀进来了,不知道这个格局未来会怎样发展。

从这个格局来看,Google对苹果的入局反应最大也是情理之中。

实际上,当年Amazon Echo推出的时候并不受到重视,然而时至今日,这款产品累积销售额据称已达10亿美元,还有市场分析机构预测,到2020年Amazon的智能音箱销售额将达100亿美元,产品销量过亿。

调查也显示,美国市场各年龄段的用户,对于语音控制设备的使用量,也呈现出了明显的增加。这也是人工智能等相关技术发展的一个结果。

智能音箱看起来好像“并不复杂”,但实际上却需要语音识别、语义分析、虚拟助手等诸多领域的人工智能技术在背后支撑。

其他要点

iOS 11

通过iCloud可将iMessage里的对话内容进行云端同步;iMessage还加入了Apple Pay,可直接在对话中进行转账。

Siri将支持微信等更多应用,并通过深度学习可以理解用户言语,结合上下文进一步知晓兴趣爱好等,甚至可以预知用户即将开启的App。

新版Camera将会支持HEVC编码格式,每张照片的压缩率将为此前的两倍。iOS 11还可以从Live视频中提取静态图片。

iOS 11还重新设计了控制中心和通知中心。iOS 11还针对中国市场加入了二维码扫描、诈骗短信识别、拼音键盘以及上海话语音识别等功能。

除此以外,macOS High Sierra提供了性能更好的Safari浏览器,新的Mail更好的支持搜索并减少存储空间。

硬件

新款iPad Pro发布。支持10小时的续航时间,12核苹果A10处理器,图像性能提升40%,配备1200万像素摄像头,支持光学防抖,支持4K视频的录制。新款iPad Pro有10.5和12.9英寸两种尺寸,售价649和799美元起。

全新iMac Pro发布,全线产品均配备27英寸5K屏幕、128GB ECC内存、4TB SSD硬盘,并搭配全新的工作站级显卡Radeon Vega。iMac Pro会配备8核、10核、18核的英特尔至强处理器,价格4999美元起。

【完】

本文作者:李林 若朴
原文发布时间:2017-06-06
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
27天前
|
机器学习/深度学习 人工智能 监控
AI算法分析,智慧城管AI智能识别系统源码
AI视频分析技术应用于智慧城管系统,通过监控摄像头实时识别违法行为,如违规摆摊、垃圾、违章停车等,实现非现场执法和预警。算法平台检测街面秩序(出店、游商、机动车、占道)和市容环境(垃圾、晾晒、垃圾桶、路面不洁、漂浮物、乱堆物料),助力及时处理问题,提升城市管理效率。
AI算法分析,智慧城管AI智能识别系统源码
|
1月前
|
人工智能 边缘计算 监控
【开源视频联动物联网平台】视频AI智能分析部署方式
【开源视频联动物联网平台】视频AI智能分析部署方式
105 3
|
3月前
|
缓存 中间件 API
【利用AI让知识体系化】入门Egg框架(含实战)(三)
【利用AI让知识体系化】入门Egg框架(含实战)
|
1月前
|
人工智能 JSON 前端开发
【Spring boot实战】Springboot+对话ai模型整体框架+高并发线程机制处理优化+提示词工程效果展示(按照框架自己修改可对接市面上百分之99的模型)
【Spring boot实战】Springboot+对话ai模型整体框架+高并发线程机制处理优化+提示词工程效果展示(按照框架自己修改可对接市面上百分之99的模型)
|
2月前
|
人工智能 机器人 Go
飞书+ChatGPT搭建智能AI助手,无公网ip实现公网访问飞书聊天界面
飞书+ChatGPT搭建智能AI助手,无公网ip实现公网访问飞书聊天界面
130 0
|
29天前
|
机器学习/深度学习 人工智能 运维
《未来智能运维:AI技术的应用与展望》
在当今数字化时代,智能运维正日益成为企业提升效率、降低成本的关键。本文将探讨人工智能技术在运维领域的应用现状与未来发展趋势,展望未来智能运维的发展前景。
46 1
|
25天前
|
人工智能 监控 算法
java智慧城管源码 AI视频智能分析 可直接上项目
Java智慧城管源码实现AI视频智能分析,适用于直接部署项目。系统运用互联网、大数据、云计算和AI提升城市管理水平,采用“一级监督、二级指挥、四级联动”模式。功能涵盖AI智能检测(如占道广告、垃圾处理等)、执法办案、视频分析、统计分析及队伍管理等多个模块,利用深度学习优化城市管理自动化和智能化,提供决策支持。
200 4
java智慧城管源码 AI视频智能分析 可直接上项目
|
21天前
|
人工智能 监控 搜索推荐
智能管理日常花销 — AI Coze打造个人财务小助手的全新体验(初版)(一)
智能管理日常花销 — AI Coze打造个人财务小助手的全新体验(初版)
42 0
|
29天前
|
人工智能 自然语言处理 安全
|
1月前
|
存储 人工智能 自然语言处理
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统
随着数字经济的发展,线上数字化远程销售模式越来越成为一种主流,销售流程也演变为线上视频会议、线下拜访等多种方式的结合。根据Gartner报告,到2025 年60%的B2B 销售组织将从基于经验和直觉的销售转变为数据驱动的销售,将销售流程、销售数据、销售分析合并形成一致的运营实践。
394 0
“智能+”时代,深维智信如何借助阿里云打造AI内容生成系统

热门文章

最新文章