[转载] 是时候学习真正的 spark 技术了

  1. 云栖社区>
  2. Apache Spark中国技术社区>
  3. 博客>
  4. 正文

[转载] 是时候学习真正的 spark 技术了

开源大数据EMR 2018-12-03 12:06:36 浏览1534
展开阅读全文

本文转自:https://mp.weixin.qq.com/s/awT4aawtTIkNKGI_2zn5NA

本站转载已经过作者授权。任何形式的转载都请联系原作者(孙彪彪/marketing@qiniu.com)获得授权并注明出处。


spark sql 可以说是 spark 中的精华部分了,我感觉整体复杂度是 spark streaming 的 5 倍以上,现在 spark 官方主推 structed streaming, spark streaming  维护的也不积极了, 我们基于 spark 来构建大数据计算任务,重心也要向 DataSet 转移,原来基于 RDD 写的代码迁移过来,好处是非常大的,尤其是在性能方面,有质的提升,  spark sql 中的各种内嵌的性能优化是比人裸写 RDD 遵守各种所谓的最佳实践更靠谱的,尤其

























































网友评论

登录后评论
0/500
评论
开源大数据EMR
+ 关注
所属云栖号: Apache Spark中国技术社区