开源SQL-on-Hadoop系统一览

  1. 云栖社区>
  2. 博客>
  3. 正文

开源SQL-on-Hadoop系统一览

勿烦 2019-02-13 16:42:39 浏览7074
展开阅读全文

引言

查询分析是大数据要解决的核心问题之一,而SQL作为查询分析中使用最简单、最广泛的的语言之一,必然而然的催生了许多支持在Hadoop上使用SQL的系统,这就是所谓的SQL-on-Hadoop系统,其中大众熟知的Hive就是最早的SQL-on-Hadoop系统。

经过若干年的发展,SQL-on-Hadoop系统已经百花齐放,按照架构划分这些系统大致可以分为以下几类:

  • MapReduce架构系统:如Hive,这类系统是在MapReduce计算框架上封装了一个SQL语义层,在运行过程中把SQL转换为MapReduce程序来执行
  • MPP架构系统:如Impala、Presto、Drill等,这类系统采用MPP(Massively Parallel Processing)架构,而非MapReduce
  • 预计算系统:如Druid、Kylin等,这类系统

网友评论

登录后评论
0/500
评论
勿烦
+ 关注