独家 | 阿里闵万里:有个现象,叫深度泛滥;有种公司,叫伪AI创业

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

 闵万里(图片由阿里提供)

今天的人工智能行业是否有些发烧?

如何降温?

人工智能专家,到底该如何创造出实际价值?

带着上面这些问题,量子位近日专访阿里云人工智能首席科学家闵万里博士。闵万里平时喜欢用花名“山景”来称呼自己。

而这个花名,来源于他的家乡大别山区。闵万里自小在山里长大,他说,如果有一天真的彻底闲下来,自己的终极理想是回山里隐居、支教。

因此下面的部分,我们也以“山景”来称呼这位科学家。

现在有个现象,叫“深度泛滥”

“我看了。但是说实话,还是希望人工智能领域能百花齐放,多一些研究方向。”当被问起是否关注了前几天在法国土伦召开的ICLR2017,有什么感受时,山景如是回答量子位。

2013年LeCun和Bengio牵头创办ICLR,被公认为机器学习&深度学习领域的顶级学术会议。

他进一步说道:“这些人都还是在讲深度学习的故事”,山景的观点是要独辟蹊径,“不是说人工智能就是深度学习。我说现在有个现象,叫‘深度泛滥’,一提到人工智能,就是深度学习,我觉得这个事情是有问题的”。

“今天所有成功的深度学习,都是一些‘黑盒子’:工程调调参,样本量大,然后进去跑。跑出来结果知其然,不知其所以然。很危险。我很不喜欢这个状态”,学数学出身的山景说:我相信一点,我们所看到的任何现象背后都是存在第一性原理的,就像牛顿三定律一样。

“如果我们对基础的、本质的东西没有了解清楚就去对它进行描述,最后很可能发现自己走上一条偏颇的道路”,这位阿里云人工智能首席科学家对量子位说:“不过这也更坚定了我的信心:我们现在应该往新的方向去走,不能局限于深度学习”。

谈到未来趋势,山景也承认深度学习会继续发展,因为它的门槛已经相对较低,“只要具备了云计算的能力,就可以去跑数据”,因此,会有很多人继续朝这个方向走。

随之而来的会是一个量变到质变的过程,当深度学习达到了一定层次的时候,就会有人从深层原理上来对其进行反推。山景认为,基础理论取得突破的一天一定会到来,而这个时间取决于技术在实际应用中铺开的速度。

当AI遍及各行各业,找不到新的应用场景时,人们就会更多地从原理上进行探索。

AI过热不完全是坏事

现在,不少创业公司的商业计划书里都非得提个“人工智能”,感觉没这几个字都不好意思见投资人,谈到当下人工智能行业的过热现象,山景说,“有的人随便整了一个数据,就叫大数据,然后号称做的是大数据建模、大数据风控之类的东西,其实他那些数据可能都是一些网上扒来的、过时的数据。这里面的泡沫非常地大。”

“还有一个比较明显的特征,你可以数一下,我们现在每周的人工智能峰会有多少?”山景笑言。

不过从另一个叫来说,他也认为这不是一件坏事。毕竟有关注才会有资源投入,促进行业发展。任何新兴行业的发展,一定会有泡沫发生,大浪淘沙后才是真英雄。“产业的发展必然从开始的一窝蜂、过热,到慢慢冷静、聚焦,最后成熟”,山景说。

而对于如何给过热的AI行业降温,山景表示,AI还是应该向实际的应用场景中去落地:“其实我觉得,我们现在做的就是在解答这个问题(指阿里工业大脑、城市大脑等)。不落地的东西说得再天花乱坠,都得不到大众的支持,老百姓的感知不一样——天天听到打雷却见不到下雨,肯定是不行的,一定要到应用当中去。”

AI专家要忘了自己是个专家

前几天,量子位在公众号上转载了第四范式知乎专栏上的一篇文章,题目叫《年薪百万的机器学习专家,为什么不产生价值?》。

文章里提到了这样一种现象:一些公司高薪聘请机器学习专家,而这些专家到来之后,也一直将自己的全部心血倾注在计算环境和模型的搭建上。

然而到最后公司发现,这些机器学习专家并没有给自己带来实际价值——原因是,专家只是专注于自己的数据准备、处理、建模、调参等工作,并未将业务和商业问题纳入自己的考虑;而专家和部门之间,又缺乏必要的联系和沟通,因此最终双方不欢而散。

那么,AI专家,或者说人工智能方面的人才到底该如何创造出真正的价值?

“我这样讲吧,十年前我是这样的状态”,山景博士扬着头,一边回想着说,“十三年前,那时候我刚刚博士毕业,我以为模型能解一切的问题。后来我很快发现了一个瓶颈:在你做的研究,发表的学术论文中,有非常多的假定条件,‘如果XXX……’,对吧?”

一个理想化的产品,从实验室走到实际生活中,这当中有非常大的不同。很多条件假设,都是不成立的,系统完全不支持。这种情况下怎么办?或者说,整个业务流程当中,根本没有这样的数据。又该怎么办?

“所以其实,人工智能领域,越是那些高大上的人,越难落地——他钻得太深了,以至于不接地气了。他不知道现实之中,该妥协、该变通的地方在哪里。我招的一些人也有这种情况,总是沉浸在细节的改进上,但其实,只是在一艘要沉没的大船上做内部装修——最后船还是沉下了水”,山景给量子位举了一个形象的例子。

在他看来,不少人工智能专家(尤其是从大学出来的),都存在不接地气的问题。

“去了公司压根没想过业务是什么。对业务场景的提炼其实比做研究还要难,你要知道哪些地方该放弃、该妥协、可以放弃、可以妥协……但是很多人没有意识到这一点,以为只是写文章发paper就好了”,山景说他后来明白发paper只是业务中一个环节而已。

来自山景的建议是:人工智能专家先忘掉自己的专家身份,多跟业务的人学一学。这样才可能实现接轨,才有可能创造价值。不然的话,你创造的价值永远只是文章,没有人能去把它落地。

而对于AI人才的职业选择,山景的建议是去那些“有业务的公司”。

“像有些人工智能的创业公司,说我搞图像识别,成功率到了99.9%,这种公司其实没前途的,因为它没业务。我见过太多这样的公司,一开始还关注它们的发展,后来发现它们大部分都被收购了,或者说偃旗息鼓了。这些都是伪创业。”

同时山景表示,阿里其实没有固定的人才培养模式,都是放到实战中去练兵。对新人会有一定的技术培训,但是很短。山景认为,战场是人才最好的训练场景。

OMT

山景老师接受采访时一直笑呵呵的。他说,可能自己的观点犀利了点,但这也确实是自己真实的看法。尤其当看到很多人人云亦云的时候,特别希望能给大家带来不一样的视角。

其实,除了阿里云人工智能首席科学家,他还有一个身份:阿里天池大数据平台的总负责人。而在这一平台上,阿里还运营着“天池大数据竞赛”。

和国外Kaggle的模式类似,天池依据赛题提供一定体量的数据,参赛者以不同的方式进行挖掘,并试图从中得出实际问题的解决方案;与Kaggle不同的是,天池会将自己的计算平台向参赛者开放。

采访当天,此次天池电力AI大赛也进行了发布。在采访中山景谈到,这次的AI电力大赛实际上就是人工智能在实际场景中落地的一个案例。

在实际生活场景中,电力系统的运行有多重不可控的因素。比如天气、企业的工作时间、甚至是经济形势,而通过合适的算法解决方案,用电效率将有可能得到极大提升,从而带来巨大的经济效益。(完)

本文作者:唐旭 
原文发布时间: 2017-05-02
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
人工智能 搜索推荐
阿里语音AI提供了个性化人声定制功能
【2月更文挑战第24天】阿里语音AI提供了个性化人声定制功能
102 2
|
1月前
|
人工智能 自然语言处理 文字识别
阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
【2月更文挑战第17天】阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
125 2
阿里推出AnyText: 解决AI绘图不会写字的问题,可以任意指定文字位置,且支持多国语言!
|
1月前
|
机器学习/深度学习 人工智能 语音技术
阿里旗下通义系列AI产品有哪些?
【2月更文挑战第16天】阿里旗下通义系列AI产品有哪些?
370 2
阿里旗下通义系列AI产品有哪些?
|
1天前
|
人工智能 决策智能 C++
【AI Agent系列】【阿里AgentScope框架】5. Pipeline模块的组合使用及Pipeline模块总结
【AI Agent系列】【阿里AgentScope框架】5. Pipeline模块的组合使用及Pipeline模块总结
12 1
|
18天前
|
Web App开发 人工智能
阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪
阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪
57 3
阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪
|
1月前
|
人工智能
阿里数赛首次向AI开放!
【2月更文挑战第24天】阿里数赛首次向AI开放!
21 1
阿里数赛首次向AI开放!
|
1月前
|
人工智能
阿里国际站推出AI极简出海计划
【2月更文挑战第19天】阿里国际站推出AI极简出海计划
59 1
阿里国际站推出AI极简出海计划
|
1月前
|
人工智能
AI一键换衣,阿里Outfit Anyone来了,电商人的福音!
【2月更文挑战第18天】AI一键换衣,阿里Outfit Anyone来了,电商人的福音!
248 2
AI一键换衣,阿里Outfit Anyone来了,电商人的福音!
|
1月前
|
人工智能
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
【2月更文挑战第15天】阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
153 2
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
|
4月前
|
人工智能 安全
有没有部署mrcp-server的阿里语音AI的相关文档啊 私有部署
有没有部署mrcp-server的阿里语音AI的相关文档啊 私有部署
97 4