独家 | 寻找数据统治力:比较Spark和Flink

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

独家 | 寻找数据统治力:比较Spark和Flink

初商 2019-08-27 23:34:04 浏览436
展开阅读全文

作者:王海涛

文章来源:微信公众号 数据派THU

翻译:张玲

校对:王雨桐


本文首先介绍了Spark和Flink的发展背景、基本架构及其设计特点,然后从数据模型、状态处理和编程模型3个角度进行比较优势和限制,最后介绍Spark和Flink的最新发展。

image.png

本篇文章属于阿里巴巴Flink系列文章之一。

当提及大数据时,我们无法忽视流式计算的重要性,它能够完成强大的实时分析。而说起流式计算,我们也无法忽视最强大的数据处理引擎:Spark和Flink。

Apache Spark自2014年以来迅速普及。它提供了一个适用常见数据处理场景的统一引擎,如批处理、流处理、交互式查询和机器学习。在某些情况下,它的性能是前一代Hadoop MapReduce的数百倍。凭借其高性能的处理和广泛的场景支持,它在大数据开发方面受到早期用户的长期青睐。

在Spark出现后不久

网友评论

登录后评论
0/500
评论
初商
+ 关注
所属云栖号: 数据派THU