Apache Flink 零基础入门(一):基础概念解析

  1. 云栖社区>
  2. 博客>
  3. 正文

Apache Flink 零基础入门(一):基础概念解析

Ververica 2019-07-02 21:14:24 浏览983
展开阅读全文

作者:陈守元、戴资力

一、Apache Flink 的定义、架构及原理

Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速计算。

1. Flink Application

了解 Flink 应用开发需要先理解 Flink 的 Streams、State、Time 等基础处理语义以及 Flink 兼顾灵活性和方便性的多层次 API。

  • Streams:流,分为有限数据流与无限数据流,unbounded stream 是有始无终的数据流,即无限数据流;而 bounded stream 是限定大小的有始有终的数据集合,即有限数据流,二者的区别在于无限数据流的数据会随时间的推演而持续增加,计算持续进行且不存在结束的状态,相对的有限数据流数据大小

网友评论

登录后评论
0/500
评论
Ververica
+ 关注