Hadoop必将风靡2012年的六个理由

简介:
文章讲的是 Hadoop必将风靡2012年的六个理由毫无疑问,Hadoop已经赢得了大量投资者和IT媒体的青睐,但却很少看到任何的实际产出。即将过去的2011是风暴来袭前的准备阶段,为很多新公司新用户建立了一个海量数据的分析平台。就连微软这样的互联网巨头都已放弃其他平台而选择Hadoop,看来Hadoop风暴来袭已指日可待。

Hadoop必将风靡2012年的六个理由
▲2011年Hadoop in China大会专题

  2012年,Hadoop必将风靡世界。以下是六个具体的理由:

  1.投资者看好Hadoop

  目前,投资者十分看好Hadoop,并开始纷纷投资相关技术。从分布式层面上来说,Hadoop开源软件整体方案供应商Cloudera已获得7600万美元投资,分布式架构新成员MapR和Hortonworks分别融资2900万美元和5000万美元;而从栈的层面上来看,Hadoop海量数据分析平台Datameer、 Karmasphere和Hadapt已分别获得了1000万美元左右投资。大量专注这一技术的初创公司(如Zettaset、Odiago和Platfora等)更是如雨后春笋般迅速涌现。另外,投资机构Accel Partners最近还成立了一个总额为1亿美金的大型数据基金,专门用于投资基于Hadoop和其他核心大型数据技术的应用。 

Hadoop必将风靡2012年的六个理由
▲ 

  2.竞争孕育成功

  Hadoop必将是未来的发展趋势,尤其是当涉及到集成管理等业务问题时。Hadoop也是Cloudera、MapR和Hortonworks能在赢取客户资源方面具有明显竞争优势的原因。

  3.学习曲线

  除了改善在分布式层面的管理和支持能力外,Cloudera、MapR和Hortonworks等公司已经开始着手提高Hadoop的易用性。同时,Karmasphere和Concurrent公司也已开始提供编写Hadoop流程和应用服务,而Datameer和IBM等公司正在努力将Hadoop普及到普通商业用户。随着越来越多的Hapdoop创业公司涌现,通过各种创新方法简化繁重的数据分析工作也将变得越来越常见。

  4.用户是永远的黄金准则

  懂得任何管理Hadoop集群和编写Hadoop应用是一回事,而将它有效地用于实际的分析管理却是另外一回事。在Hadoop World大会和网络博客上经常可以看到Walt Disney、Orbitz、LinkedIn、和Etsy等很多大公司通过讲述自己的亲身实践大赞Hadoop。用户口碑永远是最有效的宣传途径。这些大用户的“亲身试法”,对很多潜在用户来说是一种无形的鼓励,也能在一定程度上帮助他们认识“从何开始、去往何处”的问题。

Hadoop必将风靡2012年的六个理由

  5.无处不在的用武之地

  像Oracle、MySQL和SQL Server等老牌数据库一样,虽然人们对此了解不多也不深,且容易被忽视,但它们无处不在,几乎所有人都听过。从长远来看,Hadoop也将发展到类似阶段。一旦遇到涉及大量非结构化的数据采集和处理时,Hadoop就有了用武之地。

  6.内容多,功能强大

  除了核心设计思想MapReduce和HDFS(Hadoop Distributed File System)外,Hadoop还包括了从类SQL查询语言HQL,到NoSQL HBase数据库,以及机器学习库Mahout等内容。Cloudera、Hortonworks和MapR都已在他们的分布式系统中加入了Hadoop项目。最近,Cloudera还成立一个名为Bigtop的项目,集成了所有Hadoop相关项目。作为一个幕后英雄,Hadoop未来必将应用于越来越多的领域,风靡全球。

Hadoop必将风靡2012年的六个理由


原文发布时间为:2011-11-28

本文作者: 唐蓉

本文来自云栖社区合作伙伴IT168,了解相关信息可以关注IT168。

相关文章
|
4月前
|
存储 分布式计算 资源调度
干翻Hadoop系列文章【03】:MapReduce概念详解
干翻Hadoop系列文章【03】:MapReduce概念详解
|
9月前
|
存储 XML 分布式计算
hadoop的系统认知
我们生活在一个数据大爆炸的时代,数据飞快的增长,急需解决海量数据的存储和计算问题Hadoop适合海量数据 分布式存储 和 分布式计算Hadoop的作者是Doug Cutting,Hadoop这个名字是作者的孩子给他的毛绒象玩具起的名字
81 0
|
存储 机器学习/深度学习 SQL
学完了Hadoop,我总结了这些重点
学完了Hadoop,我总结了这些重点
141 0
学完了Hadoop,我总结了这些重点
|
SQL 分布式计算 大数据
你必须知道的9大Hadoop公司
如果你有大量的数据,那么Hadoop已然,或者即将应当进入你的视野。 当下最时髦且富有盛名的大数据管理系统原来只用在像谷歌、雅虎这样的互联网大咖,现在已经逐渐渗透到众多企业中。原因主要有以下两点:1)企业也在产生越来越多需要管理的数据,而Hadoop是一个非常棒的平台,特别是它能够合并遗留的旧数据,新数据和非结构化的数据。
2549 0
|
分布式计算 Hadoop
免费分享一套详细的Hadoop学习视频
最近在整理资料的发现了一套以前讲Hadoop时录制的全套的视频,想着与其让它一直带在云盘里没啥用还不如分享出来给想这方面内容的小伙伴。
免费分享一套详细的Hadoop学习视频
|
SQL 存储 缓存
与 hadoop 对比,如何看待 spark 技术?
我先说我个人的结论。 我的结论必须基于2017年9月初这个时间节点。因为未来,是存在一切可能的变数的。 1.Hive 在短期2-3年内,仍然无法被取代。大部分中大型互联网公司的sql类大数据分析job,70%以上都仍旧会跑在hive上。 2.presto / impala / sparksql / hive on tez . 我认为presto目前是最有可能胜出的一个。 3.spark 的地位有些尴尬。在大热之后,我不太看好他的未来。 我当然会慢慢来说我为什么会下这些结论。 首先,我在说几个我在工作当中看到的事实: 1.spark在小数据集的优势明显。 spark更容易编写类
172 0
|
分布式计算 Hadoop Apache
【译】Hadoop发生了什么?我们该如何做?
许多组织都关注Hadoop生态系统的最新发展,并承受着展示数据湖价值的压力。对于企业来说,至关重要的是确定如何在Hadoop失败后成功地实现应用程序的现代化,以及实现这一目标的最佳策略。Hadoop曾经是最被炒作的技术,如今属于人工智能。当心炒作周期,有一天你可能不得不为它的影响负责。
【译】Hadoop发生了什么?我们该如何做?
|
分布式计算 Java Hadoop
学习hadoop需要什么基础
“学习hadoop需要什么基础”这已经不是一个新鲜的话题了,随便上网搜索一下就能找出成百上千篇的文章在讲学习hadoop需要掌握的基础。再直接的一点的问题就是——学Hadoop难吗?用一句特别让人无语的话回答就是:难不会,会不难!
1937 0
|
存储 分布式计算 大数据
|
分布式计算 监控 Hadoop

热门文章

最新文章

相关实验场景

更多