实时计算Flink——发展历程

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 起源:脱胎于双十一实时大屏业务 实时计算 Flink脱胎于阿里巴巴集团内部双十一实时大屏业务,在阿里巴巴集团内部从最开始支持双十一大屏展现和部分实时报表业务的实时数据业务团队,历经多年的长期摸索和发展,到最终成长一个独立稳定的云计算产品团队。
  • 起源:脱胎于双十一实时大屏业务

    实时计算 Flink脱胎于阿里巴巴集团内部双十一实时大屏业务,在阿里巴巴集团内部从最开始支持双十一大屏展现和部分实时报表业务的实时数据业务团队,历经多年的长期摸索和发展,到最终成长一个独立稳定的云计算产品团队。实时计算 Flink期望将阿里巴巴集团本身沉淀多年的实时计算产品、架构、业务能够以云产品的方式对外提供服务,助力更多中小企业实时化自身大数据业务。

  • 萌芽阶段:开源Flink作为基础

    最初阿里巴巴集团支撑双十一大屏等业务同样采用的是开源的Flink作为基础系统支持,并在上面开发相关Flink代码。这个时期的实时业务处于萌芽阶段,规模尚小。数据开发人员使用Flink原生API开发流式作业,开发门槛高,系统调试难,存在大量重复的人力工作。

  • 发展阶段:基于Flink的API开发

    阿里巴巴集团的工程师针对这类大量重复工作,开始考虑进行业务封装和抽象。工程师们基于Flink的API开发出大量可复用的数据统计组件。例如,实现了简单过滤、聚合、窗口等等作为基础的编程组件,并基于这类组件提供了一套XML语义的业务描述语言。基于这套设计,流式计算用户可以使用XML语言将不同的组件进行拼装描述,最终完成一整套完整的实时计算处理流程。基于XML+Flink组件的编程方式,从底层上避免了用户大量的重复开发工作,同时亦降低了部分使用门槛。但我们的数据分析人员仍然需要熟悉整套编程组件和XML描述语法,这套编程方式离分析人员最熟悉的SQL方式仍然差距甚远。

  • 现阶段:Flink SQL开发完成

    任何技术的发展一定遵循 小众/创新 到 大众/普及 的成长轨迹。而从小众到大众,从创新到普及的转折点,一定在于技术的功能成熟和成本降低。阿里巴巴工程师开始思考如何更大程度``降低数据分析产品门槛,从而普及到更多的用户。得益于用户群对关系型数据库几十年的沉淀。阿里工程师最终开发一套Flink SQL替换了原有的XML+组件的编程方式,使用经典的SQL模式去计算和处理数据。
    这套系统成为今天实时计算 Flink的核心计算引擎(Flink)。当前这套系统以单机群数千台机器规模,在阿里巴巴集团内部服务20+BU。日均消息处理数千亿级,流量近PB级别,成为阿里巴巴集团最核心的流式计算集群。

    Flink SQL的优势

    • 可以对标SQL功能。从而提高开发人员的技术成熟度。
    • 可以利用用户熟悉的SQL模型。可极大降低用户上手使用实时计算的门槛。

当前实时计算 Flink在原有Flink系统基础上,更加丰富和提升了用户的使用体验。包括提供一整套的开发平台,完整的流式数据处理业务流程。使用实时计算 Flink,受益于阿里大数据多年的技术和业务沉淀,您可以完全享受到阿里巴巴集团最新最前沿的计算引擎能力,业务上可规避阿里巴巴集团多年在流式大数据的试错和教训,让您可以更快、更轻松地实时化大数据处理流程,助力业务发展。

本文转自实时计算——发展历程

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
29天前
|
SQL 存储 API
阿里云实时计算Flink的产品化思考与实践【下】
本文整理自阿里云高级产品专家黄鹏程和阿里云技术专家陈婧敏在 FFA 2023 平台建设专场中的分享。
110808 100
阿里云实时计算Flink的产品化思考与实践【下】
|
3月前
|
存储 SQL 分布式数据库
OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案
OceanBase X Flink 基于原生分布式数据库构建实时计算解决方案
|
3月前
|
供应链 流计算
飞鹤基于阿里云实时计算Flink构建数字化运营管理体系
飞鹤借助实时计算Flink等产品,构建数字化运营管理体系,建立实时预警机制,提前窥探风险,为供应链等业务决策提效。
623 0
|
4月前
|
大数据 流计算
掌阅科技基于阿里云实时计算Flink构建数据基建平台
掌阅科技专注于数字阅读,是全球领先的数字阅读平台之一。基于数字阅读平台的海量用户,掌阅通过阿里云实时计算Flink等大数据计算和分析服务,搭建商业化、用户增长、推荐服务等数据基建平台,实现商业化增值与用户阅读体验的结合。
405 0
|
4月前
|
SQL 消息中间件 关系型数据库
基于Flume+Kafka+Hbase+Flink+FineBI的实时综合案例(四)实时计算需求及技术方案
基于Flume+Kafka+Hbase+Flink+FineBI的实时综合案例(四)实时计算需求及技术方案
76 0
|
4月前
|
SQL 大数据 Serverless
什么是阿里云实时计算Flink版
什么是阿里云实时计算Flink版
46 1
|
5月前
|
运维 监控 调度
小米基于 Flink 的实时计算资源治理实践
小米基于 Flink 的实时计算资源治理实践
103 0
|
8月前
|
NoSQL 关系型数据库 MongoDB
版本发布|实时计算 Flink 版(2023-08-21 版本)
本文为您介绍 2023 年 8 月 21 日发布的 Flink 全托管版本的重大功能变更和主要缺陷修复。
626 0
|
8月前
|
Apache 流计算
专家老师带教!现场答疑!阿里云实时计算 Flink 版线下训练营北京站来啦!
阿里云实时计算 Flink 版线下训练营北京站来啦!专家老师现场教学,真实还原实时计算业务和实时数仓场景,现场有机会领取 Flink 最新周边礼包!
578 0
专家老师带教!现场答疑!阿里云实时计算 Flink 版线下训练营北京站来啦!
|
8月前
|
SQL NoSQL 算法
实时计算 Flink 产品新增 MongoDB CDC Connector
阿里云实时计算 Flink 产品新增 MongoDB CDC Connector,支持高效地从 MongoDB 数据库中捕获实时增量和历史数据同步到下游系统。
224 0