Hadoop大数据平台实战(02):HBase vs. Hive vs. Impala 对比

  1. 云栖社区>
  2. Java技术进阶>
  3. 博客>
  4. 正文

Hadoop大数据平台实战(02):HBase vs. Hive vs. Impala 对比

徐雷frank 2019-04-06 12:35:57 浏览1000
展开阅读全文

Hadoop大数据平台中非常重要的三个技术:HBase vs. Hive vs. Impala。他们之间的关系和区别。

Apache™Hadoop是目前最流行的开源大数据平台,核心组件使用Java语言开发。

Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。 它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。 该库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,从而在计算机集群之上提供高可用性服务,每个计算机都可能容易出现故障。

1)Hadoop:最流行的开源大数据平台,主要框架使用Java开发。

2)HBase:面向列的开源NoSQL分布式数据库,基于HDFS,起源于谷歌的论文BigTable。

3)Hive:开源分布式数据仓库工具,至于类SQL语法




网友评论

登录后评论
0/500
评论
徐雷frank
+ 关注
所属云栖号: Java技术进阶