阿里巴巴CTO张建锋:大数据+计算+算法才是未来

简介: “不论是人工智能还是其他前沿技术,都离不开高质量的数据、强大的计算平台和高效的算法平台。”阿里巴巴集团CTO张建锋在西雅图表示,“只有这三件事放在一起,才能真正在机器学习和人工智能领域取得突破。”
不论是人工智能还是其他前沿技术,都离不开高质量的数据、强大的计算平台和高效的算法平台。 ”阿里巴巴集团CTO张建锋在西雅图表示,“只有这三件事放在一起,才能真正在机器学习和人工智能领域取得突破。”

8月6号,阿里巴巴在西雅图举办技术论坛,有近400名当地的技术人才参加,除了有架构、中间件、搜索等技术负责人到场介绍干货,阿里CTO张建锋也第一次在美国分享阿里的技术战略。

da6616995a9242612afea32fc2c4594bc86dd1cb
经过4个月的思考,张建锋选择这个场合,首次围绕数据、计算和算法三个核心,系统阐述了阿里的技术布局。

为什么阿里是一家大数据公司

阿里巴巴之所以将自己定位成大数据公司,是因为拥有非常多的高质量数据。 “今天大数据做的最好的,都是平台性的企业,比如Facebook和Google,因为他们有海量的高质量的数据,” 张建锋表示,“与之相比,阿里的数据不但种类丰富,而且含金量特别高。”

阿里的数据有三个明显的特征:首先阿里的数据是用户通过购买行为投票产生的,和搜索等场景相比,更加真实;其次相较于社交等数据,阿里的数据高度结构化,例如淘宝上的商品描述就高达一百多个纬度;第三非常密集而且实时,不管在无线还是PC端,阿里日常都有超过1亿用户在访问。
67ebab125fb78bd6d7623818ab0265b075eb5993
这几点再加上整个阿里生态整合的多场景数据,对大数据的发展,可谓得天独厚。

计算平台需要大规模数据训练

在计算平台的构建方面,得益于大规模数据训练的优势,阿里巴巴做了大量的技术创新。除了围绕开源计算平台Hadoop生态所做的各项工作,如流计算和批处理,阿里还有两个非常高效的自研计算平台:离线计算平台ODPS和实时计算平台Galaxy,不但承载阿里日常的海量计算工作,而且通过阿里云对外提供服务。

在大量的实践中才能发现更多改进方向,所以阿里有机会真正改变计算平台的效率。”张建锋表示。


张建锋还谈到为什么阿里巴巴能够在7年之前就洞察到云计算的未来,“阿里一直做平台化业务,交易平台既然可以共享,计算能力为什么不能?所以我们比大多数公司更早意识到,计算可以变成水电煤一样的公共服务。”张建锋回忆到。

如今阿里云已经成为中国最大云计算平台,提供包括IaaS、PaaS、SaaS在内的完整服务。

高效的算法挖掘更大数据价值

对于算法,张建锋认为, 算法必须和行业场景进行高度的结合 ,在实验室中并不能研究出真正高效的算法,而阿里巴巴最大的优势就是能够提供多样化的、极其丰富的场景。数据、计算平台和算法的结合,是未来非常重要的趋势。

强大的计算平台加上高效算法,能够进一步挖掘数据价值,最大化数据效率,形成正向循环。而云计算则能加速数据融合,例如孤立的看气象数据价值有限,但和农业或商业结合,就会产生巨大化学反应。而传统制造业如果能充分利用大数据,也将有助于大幅提升良品率。

目前阿里正积极推进与交通部门、气象部门、制造业等多个行业的合作,让数据产生更大价值。“我们坚信大数据总有一天会改变所有行业,所以阿里目前在各个领域都有新的探索。”张建锋表示。

阿里未来技术布局

展望未来技术布局时,张建锋重点谈到VR/AR、人工智能和物联网。在他看来,当前的世界变化之大超越了人们的想象,不断涌现各种新技术,但未来究竟是怎样的,所有人都在探索,并无定论。

“从PC到无线,迭代周期非常短,很多公司还没有反应过来,已经进入无线时代,很多企业就没有了。”张建锋谈到大热的VR/AR时以此类比。VR/AR技术代表着从二维空间到三维空间的趋势,让我们对世界的理解更深入。


目前人工智能的技术方向很多,爆发性的出口还没有明确答案,在张建锋看来,最有可能获得成功的,是对消费的趋势、对数据和场景规模化有研究的人,阿里将在这方面投入更多的资源。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
机器学习/深度学习 算法
递归算法题练习(数的计算、带备忘录的递归、计算函数值)
递归算法题练习(数的计算、带备忘录的递归、计算函数值)
|
1月前
|
算法 Java
算法:Java计算二叉树从根节点到叶子结点的最大路径和
算法:Java计算二叉树从根节点到叶子结点的最大路径和
|
15天前
|
JavaScript 前端开发 大数据
数字太大了,计算加法、减法会报错,结果不正确?怎么办?用JavaScript实现大数据(超过20位的数字)相加减运算。
数字太大了,计算加法、减法会报错,结果不正确?怎么办?用JavaScript实现大数据(超过20位的数字)相加减运算。
|
3月前
|
算法 搜索推荐 图计算
图计算中的社区发现算法是什么?请解释其作用和常用算法。
图计算中的社区发现算法是什么?请解释其作用和常用算法。
25 0
|
3月前
|
算法
bellman_ford算法与dijkstra为什么dijkstra算法不能计算带有负权边图
bellman_ford算法与dijkstra为什么dijkstra算法不能计算带有负权边图
22 0
|
3月前
|
算法 定位技术 Python
地图权重计算(算法题)
地图权重计算(算法题)
22 0
|
3月前
|
算法 搜索推荐 数据挖掘
图计算中的图算法有哪些常见的类型?请举例说明每种类型的算法。
图计算中的图算法有哪些常见的类型?请举例说明每种类型的算法。
36 0
|
3月前
|
算法 搜索推荐 Java
图计算中的PageRank算法是什么?请解释其作用和计算原理。
图计算中的PageRank算法是什么?请解释其作用和计算原理。
21 0
|
3月前
|
算法 搜索推荐 Java
图计算中的图剪枝算法是什么?请解释其作用和常用方法。
图计算中的图剪枝算法是什么?请解释其作用和常用方法。
14 0
|
3月前
|
机器学习/深度学习 存储 算法
数据结构与算法面试题:给定非负整数 m 和 n,计算不大于 m 的数字中,素数的个数。(提示:算法原理为埃氏筛、线性筛)
数据结构与算法面试题:给定非负整数 m 和 n,计算不大于 m 的数字中,素数的个数。(提示:算法原理为埃氏筛、线性筛)
35 0

热门文章

最新文章