《Spark大数据分析实战》——3.1节SQL on Spark

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《Spark大数据分析实战》——3.1节SQL on Spark

华章计算机 2017-05-02 11:37:00 浏览1417
展开阅读全文

本节书摘来自华章社区《Spark大数据分析实战》一书中的第3章,第3.1节SQL on Spark,作者高彦杰 倪亚宇,更多章节内容可以访问云栖社区“华章社区”公众号查看

3.1 SQL on Spark
AMPLab将大数据分析负载分为三大类型:批量数据处理、交互式查询、实时流处理。而其中很重要的一环便是交互式查询。大数据分析栈中需要满足用户ad-hoc、reporting、iterative等类型的查询需求,也需要提供SQL接口来兼容原有数据库用户的使用习惯,同时也需要SQL能够进行关系模式的重组。完成这些重要的SQL任务的便是Spark SQL和Shark这两个开源分布式大数据查询引擎,它们可以理解为轻量级Hive SQL在Spark上的实现,业界将该类技术统称为SQL on Hadoop。
在Spark峰会2014上,Datab

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属云栖号: 华章计算机