备案控制台

开发者社区

开发者社区阿里云实时计算Flink 文章正文

Flink入坑指南第一章 - 简介

2018-12-27 14167

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，5000CU*H 3个月

简介：

Flink入坑指南系列文章，从实际例子入手，一步步引导用户零基础入门实时计算/Flink，并成长为使用Flink的高阶用户。本文属个人原创，仅做技术交流之用，笔者才疏学浅，如有错误，欢迎指正。转载请注明出处，侵权必究。

Flink是什么

这是个很玄妙的问题。在以下网站上做了很专业的介绍。

Flink官网：https://flink.apache.org/
Flink中文官网：https://flink-china.org/

如果你是大数据从业人士，简单理解，在功能上：flink>storm=jstorm=spark streaming。玩过大数据的同学对这些系统应该都不陌生。作为流计算领域的后起之秀，flink架构设计先进，ms级延时，支持Exactly once语义等，逐渐受到广大工程师的青睐，有越来越多的公司开始入坑Flink。

如果你是大数据小白，应该怎么理解Flink呢？

Flink是个分布式实时计算引擎
可以通过SQL/DataStream API来提交Flink作业
可以解决低延时/大数量/精确计算的业务需求
还不理解？那么就跟我们的文章一步步来探索吧。

有问题？点我提问

实时计算产品是什么

官方介绍 -- 阿里云实时计算(Alibaba Cloud Realtime Compute)（原阿里云流计算）是一套基于Apache Flink构建的一站式、高性能实时大数据处理平台，广泛应用于流式数据处理、离线数据处理、DataLake计算等场景。

实时计算底层计算引擎用的就是Flink，并且底层Flink版本与开源相比，在SQL解析层以及Runtime层都做了大量优化，SQL支持更完善，性能更优秀。实时计算产品使用的Flink版本中的各项feature会开源，逐步推回社区。

实时计算产品在Ali内部的引擎上，做了产品化包装，开发了一套开发+运维IDE，并且与其他阿里云产品的交互做了大量工作。在核心功能上，实时计算产品=Flink，因此以后系列文章中，用Flink代替产品名称。

有问题？点我提问

本教程适合人群

对Flink有浓厚兴趣，想用Flink解决实际生产中的各种问题。
如果你是：

技术小白，不会写SQL。请移步google/百度，先学习一下SQL的基本知识。
有一定技术基础，并且会写SQL。恭喜你，你已经具备了学习Flink的基础知识。
大数据从业人员，从本教程中，也可以学到很多原理性知识，从而成长称为优秀的Flink高阶开发人员。

有问题？点我提问

适合场景

Flink能解决什么问题？如果你的场景：

流量大：单机搞不定
实时性要求高：s/ms级延时
计算逻辑复杂：有各种聚合/分组/关联等复杂操作
恭喜你，入坑实时计算/Flink。

也可以参考目前我们收集的用户案例，来判断Flink是否适合你的场景。
如果你有任何Flink使用的优质案例，欢迎投稿，联系我们：点我提问。

如果你不确定Flink是否适合解决你的问题？点我提问。
如果你不确定你的需求在Flink中如何实现？点我提问。
如果你对实时计算产品/Flink有任何问题？点我提问

文章标签：

实时计算 Flink版

云原生大数据计算服务 MaxCompute

流计算

SQL

大数据

关键词：

实时计算 Flink版简介

相关实践学习

基于Hologres轻松玩转一站式实时仓库

本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。

Linux入门到精通

本套课程是从入门开始的Linux学习课程，适合初学者阅读。由浅入深案例丰富，通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员，只要能够坚持把所有章节都学完，也一定会受益匪浅。

小白薇薇

目录

相关文章

yuanzhengme

|

1月前

|

分布式计算 API 数据处理

Flink【基础知识 01】（简介+核心架构+分层API+集群架构+应用场景+特点优势）（一篇即可大概了解flink）

【2月更文挑战第15天】Flink【基础知识 01】（简介+核心架构+分层API+集群架构+应用场景+特点优势）（一篇即可大概了解flink）

yuanzhengme

56 1 1

1344923649437553

|

7月前

|

Prometheus 监控 Cloud Native

Flink Metrics 简介

Fink Metrics 是 Flink 内部的一个度量系统，除了可以在 Flink UI 上展示运行时的指标，也可以对外暴露接口集成到第三方系统，本文详述了这两方面的应用

1344923649437553

222 0 0

峡谷电光马仔

|

分布式计算 Java Hadoop

flink hadoop 从0~1分布式计算与大数据项目实战（4）zookeeper内部原理流程简介以及java curator client操作集群注册，读取

flink hadoop 从0~1分布式计算与大数据项目实战（4）zookeeper内部原理流程简介以及java curator client操作集群注册，读取

峡谷电光马仔

228 0 0

flink hadoop 从0~1分布式计算与大数据项目实战（4）zookeeper内部原理流程简介以及java curator client操作集群注册，读取

azlr2a666ct4i

|

存储 SQL 分布式计算

Flink 引擎简介｜青训营笔记

从产品技术来看，Flink 具备如下流计算技术特征：完全一次保证：故障后应正确恢复有状态运算符中的状态；低延迟：越低越好。许多应用程序需要亚秒级延迟；高吞吐量：随着数据速率的增长，通过管道推送大量数据至关重要；强大的计算模型：框架应该提供一种编程模型，该模型不限制用户并允许各种各样的应用程序在没有故障的情况下，容错机制的开销很低；流量控制：来自慢速算子的反压应该由系统和数据源自然吸收，以避免因消费者缓慢而导致崩溃或降低性能；乱序数据的支持：支持由于其他原因导致的数据乱序达到、延迟到达后，计算出正确的结果；完备的流式语义：支持窗口等现代流式处理语义抽象；

azlr2a666ct4i

184 0 0

Flink 引擎简介｜青训营笔记

ybbf7fwncy2w2

|

存储 SQL 资源调度

环境篇之 flink 简介|学习笔记

快速学习环境篇之 flink 简介

ybbf7fwncy2w2

102 0 0

环境篇之 flink 简介|学习笔记

vohelon

|

分布式计算大数据数据处理

Flink 简介

vohelon

202 0 0

平凡人笔记

|

消息中间件分布式计算大数据

Flink原理简介和使用(3)

Flink原理简介和使用(3)

平凡人笔记

172 0 0

Flink原理简介和使用(3)

平凡人笔记

|

流计算

Flink原理简介和使用(2)

Flink原理简介和使用(2)

平凡人笔记

176 0 0

Flink原理简介和使用(2)

平凡人笔记

|

Java 流计算

Flink原理简介和使用(1)

Flink原理简介和使用(1)

平凡人笔记

187 0 0

Flink原理简介和使用(1)

平凡人笔记

|

资源调度 Kubernetes 监控

Flink部署、使用、原理简介（下）

Flink部署、使用、原理简介（下）

平凡人笔记

136 0 0

Flink部署、使用、原理简介（下）

阿里云实时计算Flink

热门文章

最新文章

阿里云实时计算Flink的产品化思考与实践【下】

Flink常见面试问题(附答案)

Flink1.18.1和CDC2.4.1 本地没问题提交任务到服务器报错java.lang.NoClassDefFoundError: Could not initialize class io.debezium.connector.mysql.MySqlConnectorConfig

flink 入门编程day02

在Rancher K8s上部署Flink时，TaskManager连接不上并不断重启可能是由多种原因导致的

flink最新master代码编译出现Java Runtime Environment 问题

有没有大佬用 springboot 启动flink 处理，发现springboot 加 schedule调度处理会内存占满情况？

面经：Storm实时计算框架原理与应用场景

如果有多个版本的Flink CDC在同一环境中运行，可能会导致Debezium版本冲突

Flink CDC有见这个报错不？

Flink CDC产品常见问题之写hudi的时候报错如何解决

Flink CDC产品常见问题之tidb cdc 数据量大了就疯狂报空指针如何解决

Flink CDC产品常见问题之flink Oraclecdc 捕获19C数据时报错错如何解决

Apache Flink官方网站提供了关于如何使用Docker进行Flink CDC测试的文档

多个2.4的Flink CDC会有debezium冲突怎么解决啊？

Flink CDC产品常见问题之使用3.0测试mysql到starrocks启动报错如何解决

Flink CDC产品常见问题之读分布式mysql报连接超时如何解决

Flink CDC产品常见问题之查询时报错如何解决

flink cdc 转换问题之类型转换如何解决

Flink CDC产品常见问题之oracel cdc 的延时很大如何解决

相关产品

实时计算 Flink版

文档详情产品详情

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

Apache Flink 入门到实战 - Flink开源社区出品

实时计算 Flink 版产品入门与实操

开源 Flink 极速上手教程

大数据实时计算框架Spark快速入门

Apache Flink 入门

相关电子书

更多

Flink CDC Meetup PPT - 龚中强

Flink CDC Meetup PPT - 王赫

Flink CDC Meetup PPT - 覃立辉

相关实验场景

更多

基于Hologres+Flink搭建GitHub实时数据大屏

基于Flink+Tair搭建实时监控大屏

5分钟上手Flink MySQL连接器

使用Flink实时发现最热Github项目

语言入门-1：环境构建

使用PolarDB-X与Flink搭建实时数据大屏

下一篇

阿里云oss简介和使用流程