【数据蒋堂】第1期:多维分析的后台性能优化手段

  1. 云栖社区>
  2. 中生代技术>
  3. 博客>
  4. 正文

【数据蒋堂】第1期:多维分析的后台性能优化手段

行者武松 2017-08-11 14:42:00 浏览773
展开阅读全文

0.png?wxfrom=5&wx_lazy=1

多维分析就是针对一个事先准备好的数据立方体实施旋转、切片(切块)、钻取等交互操作的过程,经常也被直接称为OLAP。它的后台运算在结构上很简单,如果用SQL语法描述,大体形式为:


SELECT D,…, SUM(M), … FROM C WHERE D’=d’ AND … GROUP BY D,…


即对立方体按某些维度分组汇总某些测度。其中C是数据立方体,D,…是选出维度,M,…是聚合测度,聚合函数也可以不是SUM。D’是切片维度,切块时条件为D IN (d,…),WHERE中还可以增加针对某些测度的条件,一般也就是选出某个区间内的值。

OLAP需要即时响应,对性能要求很高,而这个运算形式虽然很简单,但数据量大时的计算量也不小,如果不设法优化,效率就可能很差。下面我们介绍多维分析后台建设时几种经常被采用的性能优化手段。


预先汇总

预先汇总是早

网友评论

登录后评论
0/500
评论
行者武松
+ 关注
所属云栖号: 中生代技术