大数据如何贡献大价值?以应用为中心

简介:

大数据

大数据之热

9月的浦东新区,天气已经略有凉意。张江高科技园区一个四周是玻璃的高档办公楼里,一大早,市场部门的资深员工李小姐正在自己的座位上开始一天工作之前的热身:倒杯水,花上一刻钟到半小时在各大网站上浏览当天要闻。在她最经常去的几个论坛里,通常汽车、服装,或者旅游促销的广告会不请自来;最近她发现这种多年不变的情形有了些不经意的变化,比如刚刚跳出的这个窗口:大数据分析帮助你锁定高价值客户“大数据”和旅游论坛有啥关系?她百思不得其解。

她所不知道的是,她在浏览器搜索界面里曾经输入的“客户”、 “促销”、“通信录”等关键词,已被IE上面挂靠的抓取程序自动获取,并且被关联了相应的广告,由IE插件完成最终的广告推送。在北京郊区某处的机房里,基于“关联规则”和“聚类”等统计分析方法的分析软件在时刻不停地处理成千上万个李小姐产生的数据。

她或许还没有注意到的是,大数据和分析正在成为全世界炙手可热的概念。先是几年前谷歌首席经济学家宣称:数据分析员正成为21世纪最性感的职业;又有2012年3月29日奥巴马政府公布“大数据研发计划” (Big Data Research and Development Initiative),白宫科技政策委员会(OSTP)还成立了大数据高层指导小组以推动这一战略规划。再有就是今年的事情了,地球人都已经知道,2013年是“国际统计年”。

几个月前,JMP的老朋友Michael Rappa教授于美国众院聆讯,主题正是“Next Generation Computing and Big Data Analytics”――下一代计算及大数据分析。Rappa教授作为IAA(Institute of Advanced Analytics, NCSU,北卡州立大学高等分析学院)创始人,去年被美国科学基金会新创立的大数据委员会任命为学术联合主席。奥巴马政府的大数据研发计划资金正是来自于美国科学基金会。

国内学术界,得益于前中国人民大学常务副校长袁卫先生及其他统计学界知名教授学者的持续不懈的努力,2012年,教育部终于把统计从数学的范畴内独立出来,正式升级成为与数学、物理、化学、计算机等大学科平级的“一级学科”。

以统计学为核心的数据分析方法正在学术、工商和政府等领域显现出越来越大的价值。李小姐电脑上的变化,则是这一趋势的小小表征。

最近Gartner发布了2013年度商业智能和分析的魔力四象限图,报告明确指出,大数据和分析正在成为企业IT规划的核心。

一切的现象都在告诉人们,一个新的科技时代似乎正在来临。有些IT职业追潮人士甚至激动地认为“人类历史上第三次科技革命”即将到来。

大数据之惑

问题在于,什么是大数据?为什么人人言必称大数据?

“很大很大的数据”就是大数据。对“大”的定义在不断刷新。10年前1GB数据已经很大了,今天,1000GB并不算太大。

问题其实不在于大,而在价值。“大数据”再大仍旧只是数据,没有足够有效的分析与应用,一切数据都是垃圾。纽约时报专栏作家David Brooks认为,缺乏足够有效的分析是大数据的最大问题:越来越多的数据,带来越来越多的相关性;其实很多相关性都是没有意义的,这种欺骗性质的数据关联会把数据管理者和使用者引入歧途,浪费大量的人力物力去管理、分析这些数据。

除了传统意义上人们认为的那些有行有列有数值或者文字的数据表单之外,IT技术还帮助人们收集了越来越多的其他类型的资料,比如视频,语音,图片,文档等。这些被称为“非结构化数据”。

结构化与非结构化数据每天都在成倍的增加。以道路视频监控为例,全上海的摄像头有10多万个,每一刻都在记录图片与视频。一旦发生案件或者事件,这些记录在硬盘库里的资料就成为侦察与审判环节的重要证据。尽管目前技术尚不支持,业界仍然期望未来能在TB乃至于PB级的视频数据里搜到一张特定身影或者脸孔。这类搜索/分析技术未来将是启动视频类大数据应用的引擎。

同样,基于语音、照片或者文本的分析与数据挖掘同样可以给人类对数据的理解带来革命性的突破。问题在于,这类技术仍停留在实验室阶段。

尽管没有足够的应用,大数据仍然不可阻挡地火热了起来。不扯上大数据似乎就要落伍了一样,大数据满天飞的日子来到了。至于这股潮流到底会演变成象.com一样的泡沫,还是第三次产业革命,在华威先生们眼里,已经根本不重要了。业界,数据库/存储等领域供应商当然乐见其成,而企业的IT经理们则又多了一个申请预算的借口。

数据的价值及企业数据战略

数据的获取与存储仍然是IT建设的基础架构。一旦决定启动“大数据战略”,对资源源源不断的占用使得这一工作黑洞化。如何规避这种大数据黑洞?结合全球主要行业领导企业以及部分小而强的欧洲企业的成功案例,我认为,应该以应用(分析及业务决策)为中心建立相应的数据战略,并且随之建立相应的从收集数据、管理数据到最终业务决策的一整套流程。而不是为数据而数据——首先要建立以应用为中心的数据战略。说到应用,银行、保险、汽车、化工等几乎所有行业都在开展以数据分析为基础的各种应用,以JMP软件全球行业案例库里面的部分典型客户为例:

  • 电商在分析顾客采购行为数据,以进行促销和相关货品推荐(交叉/提升销售)
  • 航空公司在调查旅客反馈,以改进空中服务(客户挽留)
  • 药厂在对临床实验数据进行分析,以判断新药的安全性和有效性(研发新产品)
  • 汽车厂商在对维修信息进行分析,以改进汽车整车和关键零部件的可靠性以提升客户满意度(挽留及获取客户)、降低客户拥有成本和车厂的保修成本(降低成本)
  • 手机公司在对手机销售量进行预测,以合理排产与优化库存(运营优化)
  • 卫生管理部门在运用数据模型对流行病趋势进行描述、监控与预测
  • 银行在对客户服务流程进行优化与改善,以提升客户满意度
  • 电脑厂商在利用客户对不同配置组合进行市场调查,以进行定价
  • 保险公司在根据保单出险情况进行保单定价的动态调整,以确保该产品基本盈利能力
  • 半导体企业在对制造全流程数据进行分析/建模/优化,以改善工艺,提升良率,从而实现成本降低与利润提升
  • 食品公司在利用数据分析和市场调查手段,研发本地客户最喜好的口味
  • 快速食品行业在利用JMP地图分析工具与人口统计学相结合,以进行门店选址,客户获取及供应链优化

只有足够有效的应用,方可获取数据的价值。企业只有在战略层面确立了数据分析的重要性,方可持续改善。以GE为例,六西格玛及相应的数据分析流程已经成为GE的全球战略与文化。不仅如何,GE还持续不懈地推动基于数据分析的持续改善工作。在高端航空发动机研发及GE能源系统业务领域方面,GE也与时俱进,导入JMP所代表的业界最高水平的实验设计(DOE)方法,以进一步提升其研发水平。

其次,一切都离不开人。与这股指数级增长的数据分析需求相对应,统计、分析类人才正成为职场上的稀缺品种和抢手货。3月初华尔街日报刊登了“全美最抢手职业排名”,数据分析类职位高居榜单第二位。这是美国。对中国来说,或许排名更高,因为稀缺。

最后,建立一整套以数据分析及决策流程,以取代传统的拍脑袋决策体系。这一点对于中国企业来说尤其需要强调。这不仅仅是对战略的有效执行,更需要企业拿出“改变”的决心和勇气,在制度层面体现出对“改变”的鼓励和包容。

在这个应用为王的年代,对于企业来说,不论是搭建基础架构还是应用软件,要不要投入,如何投入,其实是个老话题了,无外乎价值与价格。大数据/云计算,不论名字如何变化,逻辑依旧。


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
14天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
27天前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
3月前
|
数据采集 搜索推荐 大数据
大数据技术在电商平台中的应用
电商平台是当今社会最为普及的购物方式之一,而大数据技术则成为了众多企业的强有力竞争力。本文将介绍大数据技术在电商平台中的应用,包括数据采集、预测分析、用户画像等方面,并探讨其对电商平台的价值和意义。
|
3月前
|
存储 机器学习/深度学习 算法
大数据时代下的智能洞察:大规模数据处理的创新与应用
在信息爆炸的时代,大规模数据处理成为了科技领域的核心挑战之一。本文将探讨大规模数据处理的定义、创新技术和广泛应用,并阐述数据驱动的决策和洞察对现代社会带来的巨大影响。
75 3
|
24天前
|
数据采集 分布式计算 大数据
Java语言在大数据处理中的应用
传统的大数据处理往往依赖于庞大的数据中心和高性能的服务器,然而随着大数据时代的到来,Java作为一种强大的编程语言正在被广泛应用于大数据处理领域。本文将探讨Java语言在大数据处理中的优势和应用,以及其在分布式计算、数据处理和系统集成等方面的重要作用。
|
1月前
|
存储 大数据 数据挖掘
云计算与大数据:从基础设施到实际应用
云计算与大数据:从基础设施到实际应用
99 0
|
3月前
|
数据挖掘
离线大数据分析的应用
离线大数据分析的应用
|
16天前
|
NoSQL 大数据 数据挖掘
现代数据库技术与大数据应用
随着信息时代的到来,数据量呈指数级增长,对数据库技术提出了前所未有的挑战。本文将介绍现代数据库技术在处理大数据应用中的重要性,并探讨了一些流行的数据库解决方案及其在实际应用中的优势。
|
21天前
|
机器学习/深度学习 人工智能 数据可视化
基于Python的数据可视化技术在大数据分析中的应用
传统的大数据分析往往注重数据处理和计算,然而数据可视化作为一种重要的技术手段,在大数据分析中扮演着至关重要的角色。本文将介绍如何利用Python语言中丰富的数据可视化工具,结合大数据分析,实现更直观、高效的数据展示与分析。