KubeCon: Flink on K8s

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 目录 集群概况 BigData Manager简介 BigData on Kubernetes 部署过程 运维 Twinkle(开发者IDE) 玩转Flink on Kubernetes WindowJoin 简介 Example illustrating a windowed stream join between two data streams.

目录

  • 集群概况
  • 玩转Flink on Kubernetes

    • WindowJoin
    • SQL

集群概况

BigData Manager简介

BigData on Kubernetes
image

部署向导

image

运维管理

image

开发者IDE

image


玩转Flink on Kubernetes

WindowJoin

简介

Example illustrating a windowed stream join between two data streams.
The example works on two input streams with pairs (name, grade) and (name, salary) respectively. It joins the steams based on "name" within a configurable window. The example uses a built-in sample data generator that generates the steams of pairs at a configurable rate.

  • Source1:name, grade
  • Source2:name, salary
  • Result:name, grade, salary
    image

过程

创建Deployment

image
image

  1. 浏览器打开

  2. 创建Deployment
  3. Organization中输入用户名
  4. Configuration:

    • Intepreter选择Blink/JAR
    • Blink Version: 3.2.1 / blink-3.2-SNAPSHOT
    • Jar URI: hdfs:///example/flink-examples-WindowJoin.jar
    • entryClass: org.apache.flink.streaming.examples.join.WindowJoin
  5. 点击Create Deployment

启动job

image
image
如上图操作

查看结果

image
image

  1. 点击“Blink UI”,跳转到Apache Flink的dashboard
  2. Jobs -> Running Jobs -> Windowed Join Example
  3. 结果日志查看:Task Managers -> Path, ID -> Log

停止Job

  1. 回到Deployment页面,点击Cancel(集群资源有限,为了后续体验,请一定停掉此job)

SQL

简介

实时热门商品, 每隔5分钟输出最近一小时内点击量最多的前 N 个商品(例子详情,请移步http://wuchong.me/blog/2018/11/07/use-flink-calculate-hot-items/ ,天池大赛的数据)

列名称 说明
用户ID 整数类型,加密后的用户ID
商品ID 整数类型,加密后的商品ID
商品类目ID 整数类型,加密后的商品所属类目ID
行为类型 字符串,枚举类型,包括(‘pv’, ‘buy’, ‘cart’, ‘fav’)
时间戳 行为发生的时间戳,单位秒

image

过程

创建Deployment

image

  1. 创建Deployment
  2. Configuration:

    • Intepreter选择Blink/SQL
    • Execution Mode:STREAM
    • Blink Version: 3.2.1 / blink-3.2-SNAPSHOT
    • Artifact:HotItem
    • Runtime Configuration:

      • state.backend.type = rocksdb
      • state.backend.rocksdb.ttl.ms = 129600000

Job信息

image

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
Linux入门到精通
本套课程是从入门开始的Linux学习课程,适合初学者阅读。由浅入深案例丰富,通俗易懂。主要涉及基础的系统操作以及工作中常用的各种服务软件的应用、部署和优化。即使是零基础的学员,只要能够坚持把所有章节都学完,也一定会受益匪浅。
相关文章
|
3月前
|
Kubernetes 固态存储 容器
pulsar on k8s
pulsar on k8s
|
21天前
|
Kubernetes 流计算 Perl
在Rancher K8s上部署Flink时,TaskManager连接不上并不断重启可能是由多种原因导致的
在Rancher K8s上部署Flink时,TaskManager连接不上并不断重启可能是由多种原因导致的
30 7
|
3月前
|
存储 Kubernetes Apache
pulsar on k8s 部署验证
pulsar on k8s 部署验证
|
1月前
|
Kubernetes 网络协议 Java
在Kubernetes上运行Flink应用程序时
【2月更文挑战第27天】在Kubernetes上运行Flink应用程序时
32 10
|
2月前
|
SQL 消息中间件 Kubernetes
flink问题之on kubernetes 构建失败如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
45 1
|
2月前
|
SQL Kubernetes Java
Flink构建问题之flink 1.11 on kubernetes构建失败如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
|
2月前
|
Kubernetes Java Apache
Flink问题之托管Kubernetes报错如何解决
Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。
24 1
|
3月前
|
分布式计算 Kubernetes Java
spark on k8s native
spark on k8s native
|
3月前
|
Kubernetes 流计算 Docker
要将Flink CDC 3.0部署到Kubernetes上
【1月更文挑战第24天】【1月更文挑战第119篇】要将Flink CDC 3.0部署到Kubernetes上
70 2
|
存储 资源调度 Kubernetes
Demo 示例:如何原生的在 K8s 上运行 Flink?
Kubernetes 相信大家都比较熟悉,近两年大家都在讨论云原生的话题,讨论 Kubernetes。本文由阿里巴巴技术专家王阳(亦祺)分享,社区志愿者翟玥整理主要介绍如何原生的在 Kubernetes 上运行 Flink。
Demo 示例:如何原生的在 K8s 上运行 Flink?

推荐镜像

更多