Apache Spark中国技术交流社区历次直播回顾(持续更新)

  1. 云栖社区>
  2. 阿里云E-MapReduce(EMR)>
  3. 博客>
  4. 正文

Apache Spark中国技术交流社区历次直播回顾(持续更新)

开源大数据EMR 2019-09-19 11:39:39 浏览4879
展开阅读全文

12月11日【实时数仓建设以及典型场景应用】
简介:
本次分享会介绍实时数仓的思路以及一些实践,包括SparkStreaming SQL引擎,以及对Delta/Kudu/Druid/阿里云多种存储组件的深度整合;同时会在这个基础上介绍一些典型案例应用

讲师:
宋军,花名嵩林 阿里云EMR高级技术专家。从事Spark内核优化,对SparkCore/SprakSQL有深入了解,Spark Contributor


12月5日【是时候改变你数仓的增量同步方案了 】
简介:
本分享会先介绍传统数据增量同步方案,之后对比新方案(完全基于Spark无需额外组件),介绍新方案如何结合最新的数据湖(delta lake)实现,同时引入spark-binlog,极大的简化了数据增量的门槛和架构。如果时间允许,我们也会简单介绍开源项目spark-binlog,del


































网友评论

登录后评论
0/500
评论
开源大数据EMR
+ 关注
所属团队号: 阿里云E-MapReduce(EMR)