大数据传统企业实施理性篇---请放慢你的步伐

简介: 一、楔子   社区的力量是巨大的,开源的诱惑也 是魅力无穷,靠忽悠无法长久的云计算已是昨日黄花,IT新贵的发力点聚焦大数据,言必称大数据,语必谈数据黄金,更有甚者,高唱2013是大数据元 年,2014必将是大数据爆发的一年。

一、楔子

  社区的力量是巨大的,开源的诱惑也 是魅力无穷,靠忽悠无法长久的云计算已是昨日黄花,IT新贵的发力点聚焦大数据,言必称大数据,语必谈数据黄金,更有甚者,高唱2013是大数据元 年,2014必将是大数据爆发的一年。而企业也已躁动不安,纷纷举旗遥相呐喊:“大数据我来了”。在此给这些企业泼盆冷水,降降温度。让大数据回归理性。

二、追本溯源-我们为什么需要大数据

  基于开源平台发展起来的大数据技术,其发展的原动力来源于企业面临的瓶颈,这些瓶颈包括三个大的方面。

  1.技术方面:

  技术方面传统的关系型数据库无法存储海量增长的历史交易信息,无法快速响应实时查询需求,其实不是不能存,而是模式本身给业务带来了不便。

  2.成本方面

  成本方面遭遇到IT巨无霸的绑架,高性能的计算能力、存储能力是以$为代价的,一方面硬件采购成本无法无天,升级维护费用连绵不绝;另一方面在此之上的操作系统、数据库系统以及应用软件等都是价值不菲,成了企业不可承受之重;而以上两点只是开始,并非结束,最可怕的东西到不在于此,而在于其一旦应用就无法替代,这才是真正致命的地方。

也因为此成就IT时代的一个又一个巨无霸们。企业的决策者们都不是傻子,至少不会像你想象中的那么傻。所以才有了对开源的热切,才有了大数据技术的机会。

  3.业务创新

  锐意创新的人总是有的,而且总是走在时代的前列,利用大数据技术能否产生新的价值呢,能否带来业务上的创新呢?我们不要以功利之心去揣测别人,即使有,我也认为这些人是最可爱的,向这些人致敬。

三、成本优势-帐不是这么算的

  成本方面大数据技术真的就有那么大优势吗?X86 PC Server比IBM小机便宜,傻子都能算出来的计算题你有什么质疑吗?其实也不尽然,大数据技术的新颖性和技术发展的不成熟,带来人力成本基本上可以直接干掉硬件成本的节约。但是如果综合起来,从直接成本和间接成本两个角度去看问题的时候,大数据的成本优势就能够体现出来了。如果再加上发展的观点、企业战略的观点看大数据,那么其成本优势则是完胜。

四、技术优势-有所为,有所不为

  以己之长,攻彼之弱,无坚不摧;以己之短,攻彼之坚,自取其辱;

  大数据技术有其自身适用领域、技术特点,同样因为其架构模式和设计原理,导致其有自身的缺陷:一方面源于自身的技术瓶颈,另一方面却是基于社区发展的约 束。大数据技术适用于互联网行业,其已经在发展过程中做过多次技术迭代和调整,其海量数据存储优势和并行计算能力已经得到验证,其数据质量控制观念也已经 形成,数据应用以数据总量体现方向和趋势,单点数据的缺失无举足轻重。而这种观点却不一定就适用传统行业,比如银行业务,你能用HBase去处理实时事务 性交易吗?言必称去IOE,只是一种战略,选个矮子比个头,就是高过去,你也没什么面子,所以去IOE,是有前提的,有些领域你还真去不了;其次,你如果 丢失了一条存取款数据,就会导致账务不平,恰好客户打印了自己的存单,钱去了何处?银行是需要给个说法的。基于此并不能说明大数据就不能应用到银行业务, 而是我们对待数据的严谨性,数据质量控制的观点必须转变,而不能继续以互联网思维模式去看待大数据在传统行业的应用,否则必然会在谩骂声中,灰溜溜的滚 蛋。

四、大数据演进路线图-业务驱动、稳扎稳打

  大数据在传统行业的实施不可一蹴而就,以存储为基础,做好数据治理和质量控制,逐步实施。立足当下,放眼未来,才是正道。下面是我所总结的一张大数据演进路线图:

  


作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章