对标Google,微软开源其人工智能CNTK

简介:

0?wx_fmt=jpeg



据彭博社报道,成为微软首席执行官的第一个月,萨蒂亚·纳德拉(Satya Nadella)就看到一个引其关注的项目。在2014年2月份演示时,微软曾使用语音识别和人工智能技术将现场对话翻译成其他语言。纳德拉表示,他希望这款工具能与Skype整合,并于3个月后在其首次公开演讲中使用。


这与微软以往的习惯不符。纳德拉已经为微软效力24年,他知道,将微软的研究产品变成现实产品的过程经常出现延误现象,部分原因是设计所致。微软的研究团队脱胎于产品团队,这让其研究人员可心无旁骛地大胆设计,无须担心自己的发明是否能赚钱,或是否适合公司使命。


但是纳德拉规定的紧张期限促使高管们没有更多时间去讨论。Skype团队项目经理莉莉安·林孔(Lilian Rincon)说:“当纳德拉下达这个命令时,我们还没有组建正式团队。”于是,他们组建了团队,并立即投入工作中,最终在纳德拉规定的期限内开发出实施翻译应用Skype Translator。


如果没有纳德拉的直接干预,这款翻译应用可能还处于学术讨论阶段。Skype Translator将为微软树立一个新的重要先例,即需要CEO亲自查看实验室的每个项目,而非死读可持续性的商业计划。这就是为何微软重组其研究团队,并调整研究团队与公司其他部门之间关系的原因。微软的目标是迅速找出最有潜力的技术,并在竞争对手复制前将其交到用户手中。


为了打破研究团队与整个公司之间的阻碍,2014年9月份,微软将微软研究院(Microsoft Research)1000多名研究人员中的半数调入名为MSR NExT的新团队。它的重点是关注那些对公司影响更大的项目,而非纯粹的研究项目。与此同时,另外一半研究人员则积极寻找更重要的方式,以便为公司产品做出更大贡献。


除了Skype,其他近来从这种转变中受益的服务还包括云生产力工具Office,运行Bing更快、更高效的服务器,增强现实头盔HoloLens等。这个举措的最新受益者还有微软智能数字助理Cortana。微软计划于周一发布数字助理Cortana的升级版,微软研究团队给与很大帮助。Cortana增加了扫描电子邮件和日历提醒功能。


在争取控制人们数字生活方面,微软正与谷歌(微博)和Facebook激烈竞争。微软研究团队的变化与其硅谷年轻竞争对手很像。Facebook应用机器学习团队工程师艾哈迈德·阿卜杜尔卡达尔(Ahmad Abdulkader)说:“微软将其研究团队完全独立出来,从而令其为公司其他部门提供更大贡献。”阿卜杜尔卡达尔也曾在微软和谷歌工作过,他称谷歌完全采取与微软相反的方法。


谷歌高级研究员杰夫·迪恩(Jeff Dean)表示,谷歌研究人员与产品团队密切合作,他们研发的所有东西对于公司其他部门来说都不是秘密。迪恩称:“我们没有这种完全独立的团队,从产品用途角度来看,他们所从事的工作几乎没有任何关系。而我们的研究团队和产品团队之间有非常密切的联系。”


迪恩说,谷歌搜索引擎和Gmail团队的研究人员与开发者共享许多工具,包括公司开源人工智能系统TensorFlow。这种亲密合作已经帮助谷歌开发出许多令人印象深刻的功能,包括Smart Reply,它能基于信息内容自动做出电子邮件回复。谷歌于2015年11月份推出这种功能,此前已经对人工智能研究了1年多时间。谷歌发言人杰森·弗雷登菲尔斯(Jason Freidenfelds)说,当谷歌决定推出Inbox应用时,用了4个月时间开发产品原型。


Facebook也正采取类似行动,旨在开发健谈的人工智能助理M,它源自2014年开始的研究项目。2014年10月份,谷歌公布了这个项目的白皮书。2015年夏季,这种技术开始在Messenger中测试。领导M开发的负责人亚历克斯·勒布伦(Alex Lebrun)每周都会与公司人工智能研究员会面,探讨哪些实验室技术可投入应用。Facebook员工可以使用名为FBLearner Flow的工具,追踪研究进展情况。员工可以访问、复制以及调整源代码,然后重新改进自己的软件。


Facebook首席技术官迈克·施洛普夫(Mike Schroepfer)说,研究实验室与其他部门的密切合作成为有效的招募工具。他说:“我对所有加入人工智能团队的人的承诺是:我们将是让你的努力尽快应用到10亿人身上的最好地方。”


但是这种方法的潜在缺点是,它同样会鼓励科学家们忽略没有明显财务潜力的项目。每个公司都在竭力保持平衡,试图避免这种短视思维滋生。举例来说,Facebook分配部分人员专注于长期研究,谷歌位于伦敦的DeepMind团队从事纯粹的人工智能研究,无需考虑立即投入商用因素。


在微软,一个更大的问题是其最有前途的研究往往最终没有成为公司的实际产品,直到对手开发出类似产品才恍然大悟。已故微软科学家、图灵奖获得者吉姆·格雷(Jim Gray)早在20世纪90年代末就设计出一款现代数字地图程序TerraServer,微软联合创始人比尔·盖茨(Bill Gates)也曾在1998年大会上展示它,并赢得很多赞誉,可是后来微软并未继续关注它。直到2005年谷歌发布地图应用,盖茨才下令微软在100天内开发出微软版本的地图应用。


盖茨与微软前首席技术官内森·麦沃尔德 (Nathan Myhrvold) 于1991年创建微软研究院,当时技术巨头贝尔实验室和Xerox PARC正在衰落。微软从卡内基-梅隆大学招募了里克·雷斯特(Rick Rashid)担任首席研究员,并创建了一个实验室。他们招募众多人才,并支持他们继续从事自己的研究。


自从成立以来就担任微软研究院咨询委员会成员的华盛顿大学计算机学教授埃德·拉佐斯卡(Ed Lazowska)说,坏消息是微软存在内部技术转让问题。他说:“微软的产品团队现在很急躁,因为他们无论做什么,似乎都很难取得成功。而纳德拉的口头禅是:我们需要对新的创意保持开放,微软研究院就是灵感的源泉。”


微软研究院副总裁周以真(Jeannette Wing)上周对拉佐斯卡的学生们发表演讲,阐述微软如何改变才能令其成为吸引人才效命的地方。她说:“我们在学术界享有盛誉,因为我们拥有巨大的科学影响力。现在我们需要强调公司影响力,同样因为我们在科学领域的巨大影响。”


Cortana的新功能是在顶级研究员与产品负责人之间的不断探讨中诞生的。Cortana团队项目经理马库斯·阿什(Marcus Ash)说,他的团队正与研究人员协作,扩展更多功能。与Cortana团队合作的微软研究团队负责人埃里克·霍尔维茨(Eric Horvitz)表示,我们正在利用微软研究院的最好创意提升微软的服务和产品。


尽管这些改变还不会立即见效,但西雅图的艾伦人工智能研究所首席执行官奥伦·埃齐奥尼(Oren Etzioni)说,公司需要良好的定位以便进行过渡。你不可能立即改变它,这是一个循序渐进的过程。


来自CEO的直接命令肯定有所帮助,Skype Translator团队努力在2014年5月份之前准备好原型,以便满足纳德拉的最后期限。微软研究院产品战略总监维克拉姆·邓迪(Vikram Dendi)说:“我没想到我们能够如此快取得进展。”如今,Skype Translator可以翻译7种语言。邓迪的任务就是追踪MSR NExT项目,并确定它们何时能够准备就绪。现在,Skype团队与研究团队每天都要对话。(风帆)


对标Google,微软开源其人工智能CNTK


0?wx_fmt=jpeg

如果你已经尝试过在Windows平台上与Cortana或Skype对话来实现操控的话,你可能会对它们到底是如何成功理解人类语言而感到好奇。现在让你一探究竟的机会终于来了——微软在昨日宣布,已在Github上向外部开发人员开源其人工智能工具包CNTK(Computational Network Toolkit)。


不得不说,微软在深度学习和人工智能上的确投入了很多研发成本,研究人员将这些现代化开发工具称为计算网络工具包(CNTK),也是希冀其能够在机器学习领域获得更多新的突破。


根据微软研究人员的描述,由于具备更为优秀的交互能力,CNTK工具包中的语音和图像识别速度比另外四个当下主流的计算工具包都更加受开发者的欢迎。鉴于深度学习活动只需要数周就可以完成,这对于微软而言的确是一个不错的成就。


为了开发CNTK,微软就必须深入研究神经网络,探究如何更好的复制人脑的学习过程。该公司还依靠其强大的计算处理能力与图形处理(GPU)能力来运行CNTK,从而处理更为复杂的算法,提高人工智能和识别能力。


去年11月,Google就开源了用于自家图片搜索功能的TensorFlow机器学习系统。但据微软首席语音科学家黄学东称,微软的CNTK工具包比我们此前所见过的任何工具包都更加疯狂,同时性能也更加强悍。


因为这个工具包如今已经开源了,所以即使是没有多少预算的研究人员也可以把这个开发包用在深度学习领域的初创企业,或是更大的数据处理公司中。


事实上,CNTK还具有着更为强大的可扩展性——开发者可以用多台计算机实现GPU的扩展,从而能够更加灵活的应对大规模的实验。随着人们对人工智能的进一步探索,这个新工具应该能够吸引来更多研究人员使用,微软在深度学习领域的竞争对手也会竞相效仿。


原文发布时间为:2016-01-28

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
7月前
|
存储 人工智能 搜索推荐
SuperAGI 一个开发优先的开源自主人工智能代理框架
供应、生成和部署自主人工智能代理
|
2月前
|
数据采集 定位技术
Google Earth Engine(GEE)——全球建筑物数据集(MSBuildings数据集)包含微软7.77忆建筑物
Google Earth Engine(GEE)——全球建筑物数据集(MSBuildings数据集)包含微软7.77忆建筑物
16 0
|
3月前
|
人工智能 自然语言处理 算法
魔搭城市行 | 南京站 · 「阿里巴巴人工智能大模型&魔搭开源社区交流论坛」成功举办
2024年1月11日下午,阿里巴巴人工智能大模型及魔搭开源社区交流沙龙 · 南京站在南京软件谷云密城L栋成功举办!
|
8月前
|
数据可视化 JavaScript 前端开发
Google开源了可视化编程框架Visual Blocks for ML
Visual Blocks for ML是一个由Google开发的开源可视化编程框架。它使你能够在易于使用的无代码图形编辑器中创建ML管道。
166 0
|
4月前
|
Java 数据安全/隐私保护
SpringBoot【集成Thumbnailator】Google开源图片工具缩放+区域裁剪+水印+旋转+保持比例等(保姆级教程含源代码)
SpringBoot【集成Thumbnailator】Google开源图片工具缩放+区域裁剪+水印+旋转+保持比例等(保姆级教程含源代码)
68 0
|
6月前
|
人工智能 自然语言处理 数据可视化
Google SGE 正在添加人工智能图像生成器,现已推出:从搜索中的生成式 AI 中获取灵感的新方法
Google SGE 正在添加人工智能图像生成器,现已推出:从搜索中的生成式 AI 中获取灵感的新方法
179 1
|
6月前
|
人工智能 自然语言处理 算法
开源与人工智能:现状与展望
开源与人工智能:现状与展望
92 0
|
9月前
|
人工智能 自然语言处理 搜索推荐
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat(1)
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
133 1
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat(1)
|
9月前
|
数据采集 人工智能 计算机视觉
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat(2)
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
101 0
|
11月前
|
机器学习/深度学习 人工智能 监控
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
115 0

热门文章

最新文章