Hadoop和大数据两个世界是合并还是冲突？-阿里云开发者社区

Hadoop和大数据两个世界是合并还是冲突？

2017-05-02 1112

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

在数据库格式领域将会发生一场战争吗？Hadoop和大数据这两个世界在企业界会合并还是冲突？就在Janath Manohararaj以蓝十字蓝盾协会（Blue Cross and Blue Shield Assoc.：美国第一大私人健康保险公司集团----译者注）数据库服务团队负责人的身份作客SiliconANGLE的流动新闻平台CUBE之前，他与CUBE的搭档主持人John Furrier和Dave Vellante在幕后提及了这些问题。这些热门话题充分激起了Manohararaj的兴趣，也开启了他在惠普Vertica大会的现场访谈。

谈及数据库以及深入探讨Hadoop的现状时，Manohararaj提醒电视观众在发展初期只存在关系数据库，大数据是如此的新颖以至于它属于市场中截然不同的阵营。就蓝十字蓝盾协会所涉及到的而言，这家健康保险供应商未看到数据库与大数据冲突的风险。恰恰相反，它预感到两个事物正在向着数据管理的目的而相互融合。

Vellante想探寻这家公司历史上是如何使用数据的。Manohararaj提到以前处理数据的老方法是每个项目都有其自己的数据仓库，由于数据的重复而导致其拥有成本非常高昂。与之相反的是，Hadoop将事情变得更加容易，带来了成本下降而性能提升。

回忆起他的公司意识到到Hadoop潜力时的那个兴奋时刻，Manohararaj承认最初在2008年蓝十字蓝盾协会就通过将Vertica引入系统而进行预数据库的配置。Manohararaj的团队立马就观察到性能的提升，比以前的速度快了十倍。

“第一步是从传统的DBMS（数据库管理系统----译者注）转移到以列为基础的数据模式。现在我们正在考虑创建一个数据湖泊（Data Lake）---- 一个统一标准的数据仓库” Manohararaj确认到。

平衡创新与遵循

关于医疗保健行业，Furrier想更多的了解蓝十字蓝盾是通过什么样的方式平衡创新需求与遵循行业规则的要求的。“就医疗保健而言”，Manohararaj解释到，“信息需要是即刻的，而这在以前是个问题。Vertica是我们应用过的最好的数据库之一。”

“Vertica就是工业界的法拉利，”Furrier也赞同这一点，并追问Manohararaj要其解释什么造就了Vertica如此的成功。Manohararaj列出了三个关键因素：

1. 性能；

2. 低成本；

3. 非常棒的支持（主动型服务，调用 (call) 和回调功能( (call backs) ）

开源与供应商分布

Manohararaj访谈中讨论的最后一个议题关注了企业大数据商业化这个兴起的进程，而这也是另外一种冲突正在发生的领域。

“你是在使用供应商分布软件还是开源的Apache Hadoop”Vellante问到，他很好奇企业是如何应对这两种销售大数据解决方案的截然不同的方法的。Manohararaj透漏这项工作正在进行当中，他们正在逐步向开源靠近：“开源总是一种挑战，学习曲线总是很陡峭的，而且你需要培训。而拥有专属解决方案，就要容易很多。”

原文发布时间为：2014-08-20

本文来自云栖社区合作伙伴“大数据文摘”，了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习

简单用户画像分析

本场景主要介绍基于海量日志数据进行简单用户画像分析为背景，如何通过使用DataWorks完成数据采集、加工数据、配置数据质量监控和数据可视化展现等任务。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

Hadoop和大数据两个世界是合并还是冲突？

大数据文摘

热门文章

最新文章

相关课程

相关电子书

相关实验场景