Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

  1. 云栖社区>
  2. 阿里云实时计算>
  3. 博客>
  4. 正文

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

巴蜀真人 2018-02-08 22:07:39 浏览8597
展开阅读全文

TopN 是统计报表和大屏非常常见的功能,主要用来实时计算排行榜。流式的 TopN 不同于批处理的 TopN,它的特点是持续的在内存中按照某个统计指标(如出现次数)计算 TopN 排行榜,然后当排行榜发生变化时,发出更新后的排行榜。本文主要讲解 Flink SQL 是如何从语法和实现上设计 TopN 的。

TopN 语法

全局 TopN

用户最关心的是如何用 SQL 写出 TopN 的查询。大家最熟悉的 TopN 的写法一般是这样的:

SELECT column_name(s)FROM table_name WHERE condition 
ORDERBY order_field [DESC|ASC]LIMIT number

如上语法是 MySQL 的 TopN 语法,使用 ORDER BY 指定排序键和排序方向,使用 LIMIT 来指定

网友评论

登录后评论
0/500
评论
巴蜀真人
+ 关注
所属云栖号: 阿里云实时计算