Hadoop大数据平台实战(01):Impala vs Hive的区别

  1. 云栖社区>
  2. Java技术进阶>
  3. 博客>
  4. 正文

Hadoop大数据平台实战(01):Impala vs Hive的区别

徐雷frank 2019-04-05 12:51:30 浏览1415
展开阅读全文

Hadoop大数据生态系统重要的2个框架Apache Hive和Impala,用于在HDFS和HBase上进行大数据分析。 但Hive和Impala之间存在一些差异--Hadoop生态系统中的SQL分析引擎的竞争。本文中我们会来对比两种技术Impala vs Hive区别?

image


Hive介绍
Apache Hive™是开源的数据仓库框架,基于Hadoop构建,使用SQL语法读取Hadoop数据,分析保存在分布式存储中HDFS或者HBase数据库中的大型数据集。

image


Hive最早由Facebook开发,后来2008年贡献给Apache软件基金会。 此外,Hive的用途非常广泛,因为它支持分析存储在Hadoop的HDFS和其他兼容文件系统中的大量数据集。 像亚马逊S3。
Hive是一个在Hadoop集群之上运行的开源数据仓库和分析包。 Hive

网友评论

登录后评论
0/500
评论
徐雷frank
+ 关注
所属云栖号: Java技术进阶