[大数据行业应用发展前景分析] 阿里潘永花报告:大数据产业将成为新的煤和石油介绍

简介: 过去的2016年,政府、行业以及大众对大数据的认知有了更进一步提升,但是大数据的应用落地及价值体现还是处在初级阶段,大数据如何促进创新创业,带来新的经济增量,如何推动传统行业转型升级,如何实现商业价值在2017年将会受到更多关注,尤其是以大数据为基石的人工智能应用将会驱动着“AI+”的发展。

免费开通大数据服务:https://www.aliyun.com/product/odps

过去的2016年,政府、行业以及大众对大数据的认知有了更进一步提升,但是大数据的应用落地及价值体现还是处在初级阶段,大数据如何促进创新创业,带来新的经济增量,如何推动传统行业转型升级,如何实现商业价值在2017年将会受到更多关注,尤其是以大数据为基石的人工智能应用将会驱动着“AI+”的发展。



文 | 阿里数据经济研究中心秘书长、阿里研究院高级专家 潘永花

2016:数据新能源价值拓展从互联网到传统行业

阿里巴巴集团董事局主席马云在10月份云栖大会上首次提到“五新”的趋势,分别是新零售、新金融、新制造、新技术和新能源。而数据正是代表的新能源,过去的发展是基于石油和煤,未来的发展是基于新的能源,那就是数据,数据是人类第一次自己创造了能源,而且数据越用越值钱。

数据作为物理世界在虚拟空间的客观映射,人、事、物都在被数据化,人与人、物与物、人与物之间瞬间就会产生大量的数据,数据成为新经济的生产要素,如同工业时代的钢铁、石油。数据新能源只有在使用中才能不断体现和衍生出价值,2016年我们看到大数据实践从互联网行业拓展到越来越多的传统行业、政府部门的实践。

1、政府部门着力推动大数据相关政策法规、机构及产业发展

自2015年9月国务院发布《关于促进大数据发展的行动纲要》,十八届五中全会公报提出要实施“国家大数据战略”之后,大数据相关地方和行业政策法规依次出台。2016年1月15日,贵州省通过了《贵州省大数据发展应用促进条例》,这是中国首部大数据地方法规,将大数据产业纳入法治轨道,以立法引领和推动大数据产业蓬勃发展。

截止2016年底,全国已有30多个地方政府部门出台了大数据相关的政策文件,10多个地方政府专门设置了大数据管理部门,统筹推进大数据发展。目前全国已建或拟建的大数据产业园区超过10个。这些大数据产业主要分布在北京、上海等比较发达的地区,并已形成了较完备的产业链,产业规模也在不断扩大,为相关企业向大数据产业迅速转型奠定了良好基础。

政府行业的信息化和数据化水平参差不齐,但作为国家大数据行动纲要的重要目标之一——政府和公共数据资源的开放共享是目前重要方向,将会大幅提升政府治理创新能力和决策水平,也有助于利用社会力量实现协同治理的目标。根据初步统计,截止2016年8月,我国共有19个地方政府部门建有数据开放平台网站。但数据开放水平和政府数据价值挖掘还有待提升,不少政府部门认识到数据即权力,对于数据共享开放持保守的态度。

另一方面,信息化水平比较高的政府部门已经着手搭建统一的大数据平台,比如海关、国税总局等在探索依赖云计算技术建立统一的大数据平台,提升部门内部数据的共享,打通信息孤岛,提升政府治理能力和水平。交通部门与互联网企业紧密合作,推动交通大数据的融合助力城市交通治理能力的加强。

2、大数据的落地与行业的互联网化和信息化水平紧密相关

2016年,大数据加速在行业应用场景的落地,从互联网行业向传统行业的渗透进程加速。但总体来看,应用水平最高的是互联网行业,在线实时的数据成为支撑互联网行业业务的基石,围绕着消费者进行个性化推荐和精准营销成为最主要的应用场景:

比如,在2016年双11期间阿里平台上的千人千面服务使得每个消费者都可以拥有自己专属的双11就是典型的智能个性化推荐的应用场景,同时基于大数据的风险控制、贷款服务和信用应用也成为数据外部化应用的典型场景;

比如蚂蚁金融的小微贷款和芝麻信用服务,依据阿里巴巴商家在平台上的数据建立的信用风险模型让商家可以获得310的贷款服务(3分钟申请,1秒钟审批,0人工干预),个人的芝麻信用分数可以应用在大量的商业消费场景中;

比如租车、酒店住宿、婚恋、签证服务等,同时也在帮助最高人民法院对“老赖”进行信用惩戒方面提供了新路径。

金融和电信行业作为信息化水平较高的行业,不仅有大量的历史数据积累,同时也越来越重视内外部数据的整合应用,从支撑业务、支撑决策,到营销类应用和风险控制类应用,数据的价值在逐渐扩大,我们还看到电信运营商的信令数据可以为交通治理服务这样的外部应用开始逐渐浮现和发展。

传统制造业、物流、医疗、农业等行业在很多点的大数据应用方面也有突破,比如“大数据+工匠精神”对于制造业的转型升级至关重要。而大数据的实时、感知和预测等特点确实可以为制造企业在降低成本,缩短生产周期,提升效率,细分产品定位,优化流程和决策等方面扮演重要的角色。

阿里巴巴目前也已经和徐工集团开始进行合作,希望利用阿里云上面的大数据能力,协助徐工建中国工业大数据平台,实现“阿里云+徐工”=“中国的Predix”,在工业大数据平台、应用及生态建设方面探索一条新路。

索菲亚在探索C2B的实践过程中,数据对于其规模化和个性化的平衡起到关键作用。索菲亚认为自己不是家具制造企业,而是一家大数据企业。在调研时我们发现,索菲亚有强大的科技团队,超过400多人,而其中300多人是在做数据加工。索菲亚利用大数据提升客户体验,提高交付效率,减少差错和库存,基本可以做到零库存水平。在索菲亚的前端需求到后端的生产系统中,数据的共享、联通和流动是实现订单准确地从需求端传递到生产制造和采购端的关键。

3.数据商业化面临诸多挑战

虽然在2015到2016年,不少地方政府主导成立了数据交易所,一些商业化的数据交易平台也上线运营,但目前基于数据的全新商业模式依然还处在探索的初级阶段,数据交易、交换及服务的商业化面临诸多挑战,比如应用场景和价值不易标准化,数据定价及资产评估问题,安全和隐私的问题,政府数据开放的速度较慢问题等。

作为新能源,数据是越用越有价值,但也正是如此,同样的数据在某个场景下价值很大,在其他场景下可能没有价值,数据的应用场景和价值不容易标准化,就如同挖金子的初期一样,真正赚钱的还是卖铁锹的,如今还没有到真正卖金子的时候。

数据与工业时代的商品有截然不同的属性,工业时代的商品是实体物品为主,基于一定成本的原料生产后,基于工厂相对标准化的大规模生产模式生产出来;而目前的数据应用水平和程度有限,数据标准化程度很低,无法按照传统的商品销售模式进行销售。

工业时代的商品经历了上百年的发展之后,已经形成了大家都认同的标准化定价模式,比如基于物权的定价模式,基本上是成本加上品牌定价;而数据的权属问题目前还是个大难题,传统物权、知识产权等都存在不适用的部分,同时数据产生的边界成本基本为零,因此目前从数据加工的成本和基于数据加工衍生出的服务出发,以API或数据集的方式销售给用户是一些在尝试的模式,比如以数据堂、聚合数据为代表的第三方数据服务公司正在采用这样的模式,还有以DaaS(Data as Services)的云服务模式提供给用户使用,但总体规模和盈利模式都远不成熟。

2017:大数据支撑AI+加速落地

2016年的AlphaGo和年底的Master通过人机大战让人工智能成了尽人皆知的概念,但外在的人机大战背后是内在的数据+计算+算法能力的崛起,正是这三个因素让诞生了60年之久的AI在今天再度成为热点。笔者曾经听一位从事机器学习领域研发的资深专家讲,猛然在2016年才意识到自己原来从事的是AI行业,以前从来没有意识到。可见AI的热度并非凭空产生,是多年的技术发展到一定阶段的结果。

2017年,大数据的发展有以下几个主要趋势:

1、数据+算法+计算能力加速AI+落地

云计算技术的日臻成熟和成本的降低奠定了大数据发展的技术基础,深度学习算法的兴起和发展使得计算+数据+算法三者支撑的人工智能走下神坛。

伴随着大数据时代的到来,多来源、实时、大量、多类型的数据可以从不同的角度对现实进行更为逼近真实的描述,而利用深度学习算法可以挖掘数据之间的多层次关联关系,为人工智能应用奠定了数据源基础。目前的人工智能应用场景都是以大数据作为基础的,比如在搜索、推荐、语音交互等场景中已经有了不少成功实践。

2.基于数据融合和外在价值的探索会诞生新商业模式

目前大数据比较成熟的场景是包括个性化推荐和营销类应用,以及风险控制、信用评估类应用。我们看到,大数据产品技术及解决方案的创新比较清晰,开源技术基础上的创新和服务是主要方向,但围绕着数据本身的新商业模式还在探索过程中。

2017年,基于数据融合和外在价值的创新模式会诞生新的商业模式,企业内外数据、线上线下数据融合产生化学反应,基于数据的创新模式给我们无限想象空间。

3.大数据开始重构传统工业和制造业的价值链

传统企业和行业用户已经开始围绕着数据进行业务流程重构和再造,以数据为核心开始尝试业务创新模式,比如C2B/C2M模式实质是以消费者数据为核心倒逼传统产业的升级转型。2017年传统工业和制造业会更多地关注数据如何驱动主要传统产业的解构、重构和再造,基于数据的传统产业转型升级成为主流。

4.围绕着数据权属、个人信息保护、跨境数据流动的相关政策法规标准出台

2016年《网络安全法》的出台引起了社会上对数据安全相关领域的强烈关注,2017年数据权属、个人信息保护以及跨境数据流动相关政策法规标准会逐渐完善,推动《网络安全法》的落地实施,促进我国大数据的健康有序发展。

正如前面所讲,数据权属的界定目前也需要有相应的法律规范出台他,它对于基于数据的创新创业影响巨大。过往几年中基于数据买卖的地下灰黑产业非常猖獗,带动了消费者个人和国家对个人信息保护的关注,但目前来看我国个人信息保护相关的法律规范尚不完善,目前只在一些法律中有零散规定,仍然存在效力层级低、法律法规协调性弱、保护内容片面等立法不足,有待于加强和完善。

同时,互联网使得数据的跨境流动变得普遍,我国越来越多的企业在通过互联网成为全球化企业,数据本地化和跨境数据流动的问题会日益凸显。大数据产业发展呼唤政策法规标准的快速跟进。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
14天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
27天前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
24天前
|
数据采集 分布式计算 大数据
Java语言在大数据处理中的应用
传统的大数据处理往往依赖于庞大的数据中心和高性能的服务器,然而随着大数据时代的到来,Java作为一种强大的编程语言正在被广泛应用于大数据处理领域。本文将探讨Java语言在大数据处理中的优势和应用,以及其在分布式计算、数据处理和系统集成等方面的重要作用。
|
1月前
|
存储 大数据 数据挖掘
云计算与大数据:从基础设施到实际应用
云计算与大数据:从基础设施到实际应用
99 0
|
16天前
|
NoSQL 大数据 数据挖掘
现代数据库技术与大数据应用
随着信息时代的到来,数据量呈指数级增长,对数据库技术提出了前所未有的挑战。本文将介绍现代数据库技术在处理大数据应用中的重要性,并探讨了一些流行的数据库解决方案及其在实际应用中的优势。
|
21天前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。
|
28天前
|
存储 NoSQL 大数据
新型数据库技术在大数据分析中的应用与优势探究
随着大数据时代的到来,传统数据库技术已经无法满足海量数据处理的需求。本文将探讨新型数据库技术在大数据分析中的应用情况及其所带来的优势,为读者解析数据库领域的最新发展趋势。
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0

相关产品

  • 云原生大数据计算服务 MaxCompute