PostgreSQL count-min sketch top-n 概率计算插件 cms_topn (结合窗口实现同比、环比、滑窗分析等) - 流计算核心功能之一

  1. 云栖社区>
  2. 阿里云数据库ApsaraDB>
  3. 博客>
  4. 正文

PostgreSQL count-min sketch top-n 概率计算插件 cms_topn (结合窗口实现同比、环比、滑窗分析等) - 流计算核心功能之一

德哥 2018-04-18 18:53:24 浏览1737
展开阅读全文

标签

PostgreSQL , 概率计算 , pipelinedb , cms_topn , count-min sketch top-n


背景

概率计算是流式计算中比较重要的基础,PostgreSQL生态中的pipelinedb提供了诸多概率计算的功能模块。

《[转]流数据库 概率计算概念 - PipelineDB-Probabilistic Data Structures & Algorithms》

由于pipelinedb还没有插件化(估计快了),citusdb社区将pipelinedb中的count-min sketch部分剥离出来,提供了一个插件cms_topn。用于估算TOP-N的值,以及它对应的出现次数。

特别适合于热点分析,例如热点APP,热点店铺,特点商品等。

count-min 论文详见

我们可以试一下cms_topn

网友评论

登录后评论
0/500
评论
德哥
+ 关注
所属云栖号: 阿里云数据库ApsaraDB