谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

简介:

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

在昨晚的 Google Cloud Next 谷歌云计算开发者大会上,华人 AI 学界的骄傲、谷歌云首席科学家李飞飞宣布了一则重大消息:谷歌收购 Kaggle。

其实,关于这事儿,近两天陆续有风声传出。但谷歌和 Kaggle 对各路媒体总是一副“无可奉告”的态度,导致大家各自猜测,但无从证实。即便是李飞飞在 Next 大会上对全世界进行宣布,也仅仅停留在“没错,我们是收购了 Kaggle,这事儿对双方都有好处”的层面;对收购细节、未来计划等信息一概无涉,更不要提收购协议和价格。

但是,Google+Kaggle,即便不进行任何发酵,也是震动数据科学、AI、机器学习三界(好吧,在很多方面“三界”本是一体)的大事件。其衍生出来的潜藏信息:对开发者社区的意义、行业走向,以及谷歌的机器学习布局等——虽然当事者惜字如金,却为嗅觉敏锐的观察者带来巨大的想象空间。这隐约使人联想起 2014 年谷歌对 DeepMind 的收购:虽则后者与 Kaggle 不管在业务、还是运营方式上都完全不同,但 Kaggle 所掌握的行业资源,只在 DeepMind 之上;两次收购对于谷歌的意义,同样位于极高的战略层面。

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

李飞飞宣布谷歌云收购 Kaggle

下面我们来整理一遍,关于此次收购迄今为止披露的所有信息。

Kaggle 简介

凡是玩数据科学和机器学习的老司机,有两个网站一定不会错过:GitHub 和 Kaggle。前者用来分享,后者进行实战练习。对于不熟悉 Kaggle 的童鞋,我们先来进行一段简介。

简而言之,Kaggle 是玩数据、ML 的开发者们展示功力、扬名立万的江湖。

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

它在 2010 创立,专注于举办数据科学周边的线上竞赛。它吸引了大量数据科学家、机器学习开发者的参与,为各类现实中的商业难题开发基于数据的算法解决方案。竞赛的获胜者、领先者,在收获对方公司提供的优厚报酬之外,还将引起业内科技巨头的注意,获得各路 HR 青睐,为自己的职业道路铺上红地毯。

因此,与 GitHub 不同的地方在于,Kaggle 为其社区提供了一整套服务。其中最有名的是它的招聘服务以及名为 Kaggle Kernels 的代码分享工具。

或许因为如此,Kaggle 社区在圈内极受欢迎:用户基数大、粘性强。通常认为 Kaggle 平台有几十万数据科学家。至于具体多少,有媒体认为是五十万,有人说八十万(李飞飞),还有人说超过一百万。

总而言之,Kaggle 是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。

而大约一年前,Kaggle 开始全力在 AI、机器学习领域发力,相关竞赛项目纷纷上马。李飞飞评论道:

“Kaggle 是搜寻、分析公共数据集,开发机器学习模型,和提高数据科学专业水平的最佳场所。”

“AI 民主化”的使命

在大会上,李飞飞发表了主题为“让 AI 民主化”的演讲。在此次演讲和之后撰写的博文里,她对谷歌收购 Kaggle 的意图给出了官方版本的解释:

“我强调 AI 民主化的重要性——我们必须降低进入 AI 领域的门槛,让 AI 技术能为尽可能多的开发者社群、用户和企业所用,让 AI 被用于解决他们各自的问题和需求。Kaggle 加入谷歌,能加速这一进程。”

冠冕一些来讲,推动 AI 技术的分享和推广,是谷歌收购 Kaggle 背后的 “mission”,即使命。

加入谷歌之后的 Kaggle

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

虽然谷歌对收购协议的内容进行保密,我们仍能从双方已透露的信息看出一些端倪。比如,有一件事是确定无疑的:Kaggle 将保留独立品牌和团队。

Kaggle 创始人 Anthony Goldbloom 也在昨晚发表博文,回顾 Kaggle 创立以来取得的成绩,对支持 Kaggle 社区的开发者表示感谢,并透露了一些将来的计划:

“ Kaggle 团队仍会是一个整体,并将作为谷歌云旗下的独立品牌运营。我们会继续扩展 Kaggle  上的竞赛和开源数据平台;并且我们会继续对所有的数据科学家、公司、和技术敞开怀抱。Kaggle Kernels 会继续对各类机器学习库和工具包组成的多样生态进行支持,不管其是否来自谷歌。

加入谷歌能让我们实现更多。此次收购,把世界上最大的数据科学社区与最先进的机器学习云结合到了一起。

加入谷歌后,我们能够向社区提供谷歌云技术。这将使大家能利用更强大的基础设施和部署服务(deployment services),进行可扩展的训练,并且帮助 Kaggle 拥有存储、获取大型数据集的能力。”

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

Anthony Goldbloom(图片与本新闻无关)

李飞飞在大会和博客上的表态,虽没有 Anthony Goldbloom 详细,但也印证了一些 Anthony Goldbloom 提到的要点。比如,飞飞老师说谷歌云将为 Kaggle 社区成员提供云机器学习开发环境,Kaggle 和谷歌云将继续支持训练和部署服务,并帮助社区存储、获取大型数据集。

结合飞飞老师对 “AI 民主化”的表态,以及在大会上回溯她亲手创建的 ImageNet、对数据库重要性进行的强调;雷锋网认为,我们应当可以期待谷歌云在数据上为 Kaggle 提供强力支持,帮助 Kaggle 社区的开发者获取更多、更有价值的数据集。而这确实击中了数据科学家和机器学习开发者的一大痛点。这无疑也将直接提升谷歌对数据科学、机器学习社区的影响力,以及在其中的口碑和品牌认同。

收购 Kaggle 之后的谷歌

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

谷歌的核心业务与 AI 紧密相关,也已经成为推动这一轮 AI 技术浪潮的主要玩家之一。AI、数据科学和机器学习对于谷歌的战略意义,已毋庸赘言。自从去年 AlphaGo 与李世石的世纪之战,谷歌的江湖声望更是如日中天。

但是,在 AI 应用和技术的各个垂直领域,如自动驾驶、语音识别、深度学习等,谷歌很可能已经感觉到压力。众所周知,谷歌 Waymo 自动驾驶业务并不是一帆风顺。在语音识别领域,微软和 IBM 屡创纪录。深度学习领域,Facebook AI 实验室 FAIR,以及 OpenAI 都在生成对抗网络 “GAN” 这一前沿技术上投入巨大,产出丰厚研究成果。业内人士对于谷歌在 AI 技术上“领先”于其它对手的印象,已经不再那么牢固(如果此前称得上“牢固”的话)。

想要维持“老大哥”地位,就要进一步投入。而有一个领域是谷歌远远甩开对手的:没错,我说的是 Tensorflow。在深度学习开源工具上,Tensorflow 的市场占有率远远超出其他任何框架、平台。因此,对于开发者这一群体,谷歌的影响力具有天然优势。而收购 Kaggle 则将这一优势无限扩大

当然,我们不要忘记,Kaggle 加入的部门是谷歌云。与竞争对手亚马逊 AWS、微软 Asure 相比,谷歌云的地位一直十分尴尬,市场占有率远远落后于前两者。此次的  Google Cloud Next 大会,重点其实是宣传谷歌在云计算上的巨大投入和决心。而细看谷歌对于此次收购的官方表态,也不乏对谷歌云将来能为 Kaggle 所提供的各种支持的强调。谷歌或许希望 Kaggle 能成为谷歌云业务的一项突破口比如借 Kaggle 平台让开发者体验谷歌云、为后者做宣传。至于其它玩法,现在不得而知,尚待将来观察。

另外,外媒纷纷猜测,收购 Kaggle 可使谷歌在雇佣尖端开发人才上获得便利。这是一个十分合情合理的推测。

周边

  • 谷歌与 Kaggle 的合作已经开始

    雷锋网消息,上个月(2 月 16 日),Kaggle 与谷歌联合举办了 Google Cloud & YouTube-8M Video Understanding Challenge。这是迄今为止世界最大规模的视频理解挑战赛。该挑战要求机器学习开发者,寻找出自动标记 Youtube 视频的方法。详情请戳这里

  • 澳大利亚媒体的哀叹:“谷歌买走了我们的 Kaggle!”

    雷锋网(公众号:雷锋网)了解到,Anthony Goldbloom 是墨尔本大学毕业生。他于 2010 年在悉尼创办 Kaggle ,但在 2011 年将公司总部迁去了旧金山,这次更是直接被美国企业收购。不出意料,对这次谷歌收购 Kaggle 报道最积极的当属澳大利亚媒体。这再次让小编联想起 DeepMind——以及它被收购后英国 AI 圈的反应。

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

相关文章:

谷歌公布 Video Intelligence API 助力视频内容搜索;Facebook 开源新一代机器学习 GPU 服务器 Big Basin | AI 开发者头条

谷歌加码机器学习,据报将收购数据科学社区 Kaggle





本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
1月前
|
机器学习/深度学习 数据采集 存储
【机器学习】机器学习流程之收集数据
【机器学习】机器学习流程之收集数据
47 1
|
29天前
|
机器学习/深度学习 存储 人工智能
为什么AI处理私有数据,需要使用向量数据库
大语言模型通过概率和向量数据库查询来生成高质量内容,当预测概率低于阈值时,利用相似性从本地数据中获取信息,向量数据库通过向量化、表示、查询、搜索和解码等步骤,帮助模型处理未知数据。
|
21天前
|
机器学习/深度学习 人工智能 运维
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(二)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
53 1
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(一)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
61 1
|
4天前
|
索引 机器学习/深度学习 Python
|
4天前
|
机器学习/深度学习 算法框架/工具 PyTorch
|
机器学习/深度学习 算法 计算机视觉
|
4天前
|
机器学习/深度学习 索引 Python
|
4天前
|
机器学习/深度学习 数据挖掘 Python
|
4天前
|
机器学习/深度学习 Python 索引

热门文章

最新文章