分布式DB数据倾斜的原因和解法 - 阿里云HybridDB for PostgreSQL最佳实践

  1. 云栖社区>
  2. 阿里云数据库ApsaraDB>
  3. 博客>
  4. 正文

分布式DB数据倾斜的原因和解法 - 阿里云HybridDB for PostgreSQL最佳实践

德哥 2017-08-26 13:31:34 浏览2525
展开阅读全文

标签

PostgreSQL , Greenplum , query倾斜 , 存储倾斜 , OOM , disk full , 短板 , 数据分布


背景

对于分布式数据库来说,QUERY的运行效率取决于最慢的那个节点。

pic

当数据出现倾斜时,某些节点的运算量可能比其他节点大。除了带来运行慢的问题,还有其他的问题,例如导致OOM,或者DISK FULL等问题。

如何监控倾斜

1、监控数据库级别倾斜

postgres=#  select gp_execution_dbid(), datname, pg_size_pretty(pg_database_size(datname)) from gp_dist_random('pg_database') order by 2,1,pg_database_size(datname) desc;
 gp_execu

网友评论

登录后评论
0/500
评论
德哥
+ 关注
所属云栖号: 阿里云数据库ApsaraDB