【思想】大数据的管理喻意

简介: 摘自《管理学家》对清华大学经管学院,陈国青教授专访   当数据完全渗透到人们生活之中,大数据带来的挑战就涉及人们生活的各个方面,在很多方面我们都可以观察到大数据时代的不同。面向大数据机遇和挑战的应对策略是进行长期部署和短期规划,一步一步走。
0.jpg

摘自《管理学家》对清华大学经管学院,陈国青教授专访

 

当数据完全渗透到人们生活之中,大数据带来的挑战就涉及人们生活的各个方面,在很多方面我们都可以观察到大数据时代的不同。面向大数据机遇和挑战的应对策略是进行长期部署和短期规划,一步一步走。从长期来看,大数据的影响是深刻的。但眼下对企业而言,应对大数据的第一步是构建BA能力(Business Analytics, 是企业具有的进行数据运作和深度业务分析的能力)。

 

近年来,“大数据”这一概念迅速流行,在业界和学界得到高度关注。事实上,“大数据”并不是从天而降的,而是时代演化的产物。当信息技术发展到云计算、大数据时代,人们的生活渐渐发生了全面的变化。从基础研究方法到各个学科,人们普遍感受了大数据的迫近,但我们要看到大数据之“热”背后的东西,以及企业需要构建哪些关键能力。

  

计算范式进化

回顾信息技术革命对社会生活的影响,可以分为几个时代:主机(Mainframe)时代,个人电脑(PC)时代,Web 1.0时代,Web 2.0时代,以及物联网/云计算/大数据时代。主机时代主要是指以大型机为主导的1960-1970年代。人们若有计算需求,就要去计算中心,把程序交给专门的工作人员负责试运行。这完全是集中式的数据管理,个人想做计算非常不方便,而且很贵。1980年代可以称作个人电脑时代。此时,大型计算机的一部分功能转移到了台式个人电脑上,人们可以在个人电脑上运行一些简单的计算功能,开始了简单的文本处理,计算开始从集中走向分散。20世纪90年代Web 1.0 兴起了,互联网帮助人们把全世界的信息联系在一起了。但此时的互联网是单向的,我们仅仅能够查询和获取信息,只能通过这个窗口向外看。到2000年前后,以互动和参与为主要特征的Web 2.0出现了。原来人们只是互联网信息的被动接受者,但此时,网民可以自己写作博客,参与维基百科的编辑,联系社会网络等等。电脑的计算功能越来越强,越来越融合在人们的生活之中。人们之间的信息沟通越来越密,社会中的信息点也越来越分散。直到近年来,出现了以物联网、云计算和大数据为标志的新时代。此时,不是单个软件或单个机器的革新,而是整个计算范式(Paradigm of Computing)的变革。这是一种新型的集中式计算:无处不在的探测感应装置、计算机网络、移动终端、云服务、社会化媒体、数字化生活使得数字世界和计算能力处于物理上高度分散和分布式状态;另一方面,物联网、云计算和大数据应用又强调信息整合、数据中心平台以及全局视图。所以,与传统集中式不同,此时呈现出物理上分散、逻辑上集中的新特点。

 

技术的发展与应用有一个刺激响应螺旋:当某个技术突破产生时,个人和组织不管主动还是被动都免不了要面对这项技术,思考诸如“要不要应用这项技术,如何应用”等问题;技术的发展又会受到这些应用要求的影响,一直互动和循环下去。一项新技术是一个刺激,个人和企业会响应并产生新需求,进而这些新需求又成为新的刺激,使得技术再做出创新响应。技术和应用需求就在这种刺激与响应中螺旋上升。在当前新型计算范式背景下,特别是从大数据的视角来审视我们面临的机遇和挑战,思考对未来的管理可能产生哪些影响,具有重要理论和实践意义。

 

大数据改变生活

现在关于大数据的说法比较多。一些提法也在涌现,如认为大数据只注重关联不注重因果、只注重总体不注重抽样等。这些观点反映了特定场景和应用的某些特点,但是作为大数据的一般属性的话,目前还缺乏足够的共识。简单说来,具有相对广泛共识的大数据特征是所谓的4V(Volume, Variety, Value, Velocity)。第一,大数据意味着超常规模数据(Volume)。与之前的大规模数据不同的地方在于,大数据对企业来讲意味着数据规模超越了企业本身的内部数据,而是延伸到了企业外部,成为一种社会化的企业数据。每个人作为终端使用者,既是信息的使用者,又是信息的创造者。全社会的人都与数据发生关联,在社会活动的各个环节,而不仅仅局限于之前的某些企业、某些部门职能环节;这是质的变化。第二,大数据意味着多样性(Variety)。富媒体(Rich Media)大大扩展了人们的数字化生活体验,全球数据和数字流量中70%~80%都是视频、语音、图像,而不是过去以二维的、规范化的、非常简单数据形式为主的结构化数据。多样性成为大数据的显著特征。第三,我们处在数据的海洋之中,但与我们企业或个人相关的数据相对说来是很少的,所以是低价值密度的(Value)。即,数据量的分母太大,对企业或个人决策有价值的信息占总量的比例就很小。所以这里有一个重要的含义,即如何从低价值密度的数据海洋中挖掘出有用信息,成为企业数据分析的关键。第四,大数据的实时性强(Velocity)。信息就像开着的水龙头一样,源源不断地出来。人们打开手机看新闻,支付账单,都需要得到及时响应,而不是等到晚上再看新闻,要排个队才能支付账单。信息是连续的,实时的,流涌的。这种流信息是时时刻刻(Real-Time)的,构成了大数据之“大”和无时不在。

 

大数据的这四个特征会给人们的科学研究方法带来挑战,当然也会影响商业和管理。

比如说对统计理论的挑战。在传统概率统计学中,因为做不到对总体进行采集,所以设计了许多抽样方法,要用到测度(如均值、方差)这些概念。在大数据背景下,很多基础的假设都需要重新检验和审视:哪些被颠覆了,哪些可能还可以用。在所有管理学理论中,统计是最基础的方法之一,所以这种审视很重要。

 

再者,比如对信息处理的挑战。传统的信息处理技术要应对具有4V特征的大数据是极有挑战性的,一方面是测度、信息处理的基本方法,另一方面是搜索、推荐等应用方法。大量的信息处理方法都只能处理结构化的数据,而无法处理富媒体数据,因而需要重新审视。譬如,30和31不相等,两个数字易于比较;而两篇博文可能只是相似,意义相接近,等等;视频和图像的比较,更需要判断其相似性而非“等于”。此时,数学上的“等于”就变成特殊的个例了,多种情况下是“约等于”,或者说相似关系。但是,已有的大量算法并不是基于“相似性”,需要重新检验。例如,数据挖掘方法中有一种关联规则算法叫做Apriori算法。这个算法是基于结构化记录的经典算法,是许多应用方法的基础。啤酒尿布问题就是关联规则算法的经典案例。然而,如果现在要处理的不是一条条的记录,而是视频、音乐,经典算法能否处理新问题就需要重新审视。第一要审视算法是否可用,第二要审视算法是否足够有效率。再如,现在我们搜索一个关键字可以很快得到结果,但搜索图片时体验还是很差的,如果要搜索一段语音、音乐,那么,搜索的响应时间、质量和精度都还远达不到人们的要求,是计算机学界需要解决的问题。考虑到处理大数据需求的是流算法,对实时性要求高,没有效率的算法势必会被抛弃。其它的挑战还涉及数据传输与存储技术、社会分析与计算技术、模式识别与语义分析技术等诸多领域。

 

当数据完全渗透到人们生活之中,大数据带来的挑战就涉及人们生活的各个方面,除了上述基础方法、信息处理方面的挑战,在很多方面我们都可以观察到大数据时代的不同。比如,智能手机和平板电脑作为一类功能强大的移动终端,通过丰富多样的客户端应用(如apps等)支持人们的各种需要(如:开展业务、网上购物、信息搜索、聊天交友、休闲娱乐等等)。这极大地扩展了企业和个人的计算触角,深化了社会化商务和移动商务,丰富了数字化的社会生活。

 

对管理趋势的影响

大数据时代的管理喻意可以从两个方面来概括,即:“三个融合”和“三新”。“三个融合”指IT融合、内外融合和价值融合。而“三新”则指大数据时代催生的新模式、新业态和新人群。这两个方面反映了大数据时代管理理论和实践的变化特征,其中前者主要体现管理领域和视角上的变化,后者则主要体现管理主体和方式上的变化。

 

信息技术融合 信息技术融合(IT融合)是指,技术与人们生活和企业运作的密不可分性。信息技术融合有很多实例和问题,概而言之,这对管理有两方面的意义:第一,越来越多的传统企业管理问题已经变成或正在变成数据管理或信息管理的问题;第二,越来越多的企业决策已经变成或正在变成基于数据分析的决策。在企业原先的运营框架中,IT支持、营销、会计、战略管理、创新可能是不同的职能,但当企业的活动和事件越来越多地用数据体现时,企业决策就要基于数据决策。

 

内外融合 内外融合强调企业外部数据的重要性。通常,企业关心内部的信息化,如ERP关注内部资源的整合,CRM系统也只是与客户建立联系,但现在,评论、口碑、商誉、流言等各类信息都是企业外部数据,而企业还必须关注,否则很可能会出现企业声誉危机。所以,企业要关注内部数据与外部数据的融合,基于内外数据的交互来做决策。用户生成内容(User Generated Content,UGC)、公共生成内容(Public Generated Content,PGC)正在发挥越来越大的作用,影响消费者的购买决策、商业舆情和企业形象,企业必须对此做出反应。

 

价值融合 价值融合是指,企业因生产产品和提供服务而产生价值,消费者在使用产品的过程中产生价值。譬如,手机制造商或者电信运营商面临着这种情况:你生产和销售手机或提供流量,会获得一些收入;但大量的价值增值并不在手机本身,而在于顾客如何使用手机。也就是说,生产有形的产品是一种价值,在此基础上的无形产品(如服务、内容)可能会带来更大的价值增值。所以,企业不但要关注有形产品,还要关心附加价值,强调服务、内容等等。

 

新模式

很多企业在探讨大数据背景下如何转型升级的问题,为了适应大数据的挑战会产生许多新模式,比如O2O(online to offline,线上线下结合的商业模式)。像线下实体电器卖场,为了适应变化要做线上电子商务平台、进行了线上线下同价、线上定购线下提货的尝试等。而线上商城为了保证时令产品及时到达顾客手中,就会租线下仓库、打通物流的上下游等。这并不意味着某些公司会消失,只是企业模式会发生改变。因为大数据情景强调企业外部知识,用户体验更重要也更丰富,比如虚拟体验、实体体验和线上线下融合的体验。企业内部也要有新模式。因为数据管理和基于数据分析的决策对企业越来越重要,企业要重点增强的一个核心能力就是深度业务分析(Business Analytics, BA)能力,而这个能力的很多方面来自商务智能和数据挖掘技术。这种分析是有深度的、严谨的,可以辅助企业在变化的环境中做出更好的决策。

 

新业态

赛博空间(Cyberspace)和众包(Crowdsourcing)、数据产业等都是相关的新业态。以前我们可能在休息的时候玩一会儿游戏,但现在有很多人生活在赛博空间的虚拟现实中。对有些人来讲,赛博空间是他们的“第二生活(Second Life)”,而对另一些人来讲甚至是“第一生活”空间。他们长期生活在其中,心理、行为可能会发生变化,也会产生一些商业机会。很多企业的主要业务就是满足这类虚拟需求的,比如说卖秘籍的,卖虚拟装备的,卖虚拟币的。虽然人们在观念认同上可能存在差异,但在这种新业态上确实产生了年销售额非常可观的企业。众包是企业外部的大众为企业出创意、做设计等工作,这种新型生产组织形式还未得到企业的足够重视,其潜力不应被低估。此外,云计算和大数据应用需要新型数据平台和资源虚拟整合优化,所以数据中心产业会兴起,这会涉及很具体的产业政策、宏观环境等整个生态系统。

 

新人群 

很多中老年人从1970年代开始学习信息处理,应该算是信息社会的“移民”,但是现在两三岁的儿童都能对iPad上瘾,是信息社会的“原住民”。虽然从年龄上来看,在岁数上差一代两代,但在技术进化来看,可能跨了很多代,中间隔着处于各种技术代的人群。如果企业的员工、客户都是这些信息社会的新生代或原住民了,那么组织行为、绩效管理、KPI、企业文化、客户关系管理都要发生改变。举例来说,和这些人沟通,除了面谈、聚会之外,微信、QQ成了更重要的沟通方式;而与老客户老员工沟通,可能还是要采取传统套路。

  

BA将成企业关键能力

面向大数据机遇和挑战的应对策略是进行长期部署和短期规划,一步一步走。从长期来看,大数据的影响是深刻的。但眼下对企业而言,应对大数据的第一步是构建BA能力。

 

BA能力是企业具有的进行数据运作和深度业务分析的能力。以移动通讯行业为例,一方面面临语音应用饱和、传统业务单位效益下降等压力;另一方面也面临着移动互联网、内容经营和信息消费的替代性和多元化服务等压力。升级和转型成为一种必然。根据数据密集型业务的特点,升级需要更精细化的管理,更好地了解客户(如:客户特征和细分、客户行为和粘性、客户喜好和新需求等)、更好地了解业务(如:业务活动轨迹、 产品体验与口碑、业务关联与因果分析等)、更好地了解对手和伙伴(如:行业动态与趋势、对手优势特征等)。而转型需要更创新性的思路,如通过内容服务和新业务平台(双边市场、LBS服务、长尾经营(如:手机阅读、音乐平台)、营销平台等),进行必要的模式创新和业务重组。其中,不管是在内部运作和管理还是外向扩展和创新方面,BA能力发挥着关键作用。此外,银行业也是数据密集型行业。在我国也不乏运用BA技术构建竞争优势的例子(如:通过分析客户行为和业务的关系,获取新的客户群,设计新产品和竞争策略)。在电子商务和信息消费领域,BA能力作为重要的业务要素和竞争能力,在产品推荐、消费者行为分析、创新设计、社会化媒体应用、企业舆情预警、信息搜索服务、潜在模式辨识等方面的作用更是举足轻重。

 

最后,值得一提的是,BA能力建设仍然是一个较为长期的任务,又是需要及时着手布局和长远规划的任务。这涉及到业务理念、战略思维、团队建设和知识储备。此外, 在大数据“热度”下,企业的敏捷感测和应对响应是必要的。同时,又需要了解其概念内涵及其管理喻意,认识到大数据只是这种“数据商务”(数据运作和基于数据分析的管理决策)发展趋势中的一个时代节点。随着这种趋势走向的深化,概念内涵和管理喻意也会以不同时代形态和节点特征丰富和发展,而BA能力的重要性将日趋体现。


原文发布时间为:2014-03-10


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
SQL 分布式计算 MaxCompute
maxcompute之配置报错如何解决
MaxCompute配置是指在使用阿里云MaxCompute服务时对项目设置、计算资源、存储空间等进行的各项调整;本合集将提供MaxCompute配置的指南和建议,帮助用户根据数据处理需求优化其MaxCompute环境。
35 0
|
7月前
|
存储 分布式计算 关系型数据库
大数据Spark偏移量管理
大数据Spark偏移量管理
33 1
|
4月前
|
安全 大数据 API
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
elasticsearch|大数据|elasticsearch的api部分实战操作以及用户和密码的管理
63 0
|
6月前
|
分布式计算 运维 监控
DataWorks如何配置MaxCompute监控进行订阅管理?
DataWorks如何配置MaxCompute监控进行订阅管理?
43 1
|
4月前
|
监控 数据可视化 安全
Java智慧工地管理平台可视化大数据建造工地APP源码
Java智慧工地管理平台可视化大数据建造工地APP源码
59 0
|
4月前
|
人工智能 监控 Java
Java数字化智慧工地管理云平台源码(人工智能、物联网、大数据)
Java数字化智慧工地管理云平台源码(人工智能、物联网、大数据)
82 0
|
7月前
|
存储 消息中间件 大数据
大数据Flink状态管理
大数据Flink状态管理
33 0
|
12月前
|
小程序 Java 人机交互
智慧校园大数据云平台源码,实现基础数据共享、应用统一管理
智慧校园云平台电子班牌系统,利用先进的云计算技术,将教育信息化资源和教学管理系统进行有效整合,实现基础数据共享、应用统一管理。借助全新的智能交互识别终端和移动化教育管理系统,以考勤、课表、通知、家校互通等功能为切入点,从班级建设、校园文化、班级文化、学生工作、信息发布、家校共育六大方面,着力打造满足用户场景,深度贴合学校教育的改革需求。
|
分布式计算 MaxCompute 数据安全/隐私保护
《MaxCompute技术公开课第四季 之 MaxCompute数据安全管理解析》电子版地址
MaxCompute技术公开课第四季 之 MaxCompute数据安全管理解析
《MaxCompute技术公开课第四季 之 MaxCompute数据安全管理解析》电子版地址
|
存储 分布式计算 关系型数据库
大数据的存储和管理(二)|学习笔记
快速学习大数据的存储和管理(二)
146 0
大数据的存储和管理(二)|学习笔记