史上最全开源大数据工具汇总

  1. 云栖社区>
  2. 博客>
  3. 正文

史上最全开源大数据工具汇总

管理贝贝 2016-02-02 17:54:02 浏览5443
展开阅读全文

史上最全的开源大数据工具,非常实用,请务必收藏!



查询引擎


  • Phoenix

Salesforce公司出品,Apache HBase之上的一个SQL中间层,完全使用Java编写


  • Stinger

原叫Tez,下一代Hive, Hortonworks主导开发,运行在YARN上的DAG计算框架


  • Presto

Facebook开源


  • Spark SQL

Spark上的SQL执行引擎


  • Pig

基于Hadoop MapReduce的脚本语言


  • Cloudera Impala

参照Google Dremel实现,能运行在HDFS或HBase上,使用C++开发


  • Apache Drill

参照Google Dremel实现


  • Apache Tajo

一个运行在YARN上支持SQL的分布式数据仓库


  • Hive

基于Hadoop MapReduce的SQL查询引擎



流式计算


  • Facebook Puma









网友评论

登录后评论
0/500
评论
管理贝贝
+ 关注