已有0人关注此标签
标签 PostgreSQL , 优化器 , 索引扫描 , 堆扫描 , IO放大 背景 通过B-TREE索引扫描可能会带来了巨大的heap page scan数目,即IO的放大. 为什么呢? 示例视频如下 : http://www.tudou.com/programs/view/yQ0SzBqx_4w/ 如果数据库的单个数据块(block_size)很大的话, 这种情况带来的负面影响也将被放大. 例如32k的block_size显然比8k的block_size扫描开销更大. 本文将讲解一下索引扫描引发的heap page scan放大的原因, 以及解决办法。
标签 PostgreSQL , 模糊查询 , 正则查询 , pg_trgm , bytea , gin , 函数索引 背景 前模糊(有前缀的模糊),后模糊(有后缀的模糊),前后模糊(无前后缀的模糊),正则匹配都属于文本搜索领域常见的需求。
背景 有一个这样的场景,一张小表A,里面存储了一些ID,大约几百个。 (比如说巡逻车辆ID,环卫车辆的ID,公交车,微公交的ID)。 另外有一张日志表B,每条记录中的ID是来自前面那张小表的,但不是每个ID都出现在这张日志表中,比如说一天可能只有几十个ID会出现在这个日志表的当天的数据中。 (比如车辆的行车轨迹数据,每秒上报轨迹,数据量就非常庞大)。 那么我怎么快速的找出今天没有出现的ID
今天遇到一个客户问我说,我从MySQL里统计我的数据占用空间只有500G左右,而云控制台和售后给我的数据都是数我的数据占用了1.5T左右的空间,那为啥有1T空间去哪里了?日志等其他文件所占空间也没有统计到数据文件中,那数据文件多占了1T的空间到底是怎么回事,是不是阿里多给我计算了占用的空间? 其实很简单,两种查询得方法肯定有不准确的地方,客户是在mysql的元数据表里information_schema.tables中查询的,而控制台显示的空间占用情况是RDS从OS层面获取的表文件占用空间情况。
最近在PostgreSQL的Mail List中参与讨论了一个问题: ANALYZE'ing table hierarchies。 网友认为在Analyze分区表的时候,只能看到主表的analyze日期更新到最新,但是子表的日期没有变化,他认为analyze应该是在分析主表的时候会