MySQL统计信息简介-阿里云开发者社区

MySQL统计信息简介

2018-01-24 4224

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

云数据库 RDS PostgreSQL，集群系列 2核4GB

简介：

MySQL执行SQL会经过SQL解析和查询优化的过程，解析器将SQL分解成数据结构并传递到后续步骤，查询优化器发现执行SQL查询的最佳方案、生成执行计划。查询优化器决定SQL如何执行，依赖于数据库的统计信息，下面我们介绍MySQL 5.7中innodb统计信息的相关内容。

MySQL统计信息的存储分为两种，非持久化和持久化统计信息。

一、非持久化统计信息

非持久化统计信息存储在内存里，如果数据库重启，统计信息将丢失。有两种方式可以设置为非持久化统计信息：

879c376f144aa0c9589941dabd9535bf36f432ff

非持久化统计信息在以下情况会被自动更新：

beb473dc16eefb60dc91a4ae9d1c39a78dadc689

非持久化统计信息的缺点显而易见，数据库重启后如果大量表开始更新统计信息，会对实例造成很大影响，所以目前都会使用持久化统计信息。

二、持久化统计信息

5.6.6开始，MySQL默认使用了持久化统计信息，即INNODB_STATS_PERSISTENT=ON，持久化统计信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。

持久化统计信息在以下情况会被自动更新：

innodb_table_stats是表的统计信息，innodb_index_stats是索引的统计信息，各字段含义如下：

acfbef5d8024047cd6465a78851bda5c67043000

为更好的理解 innodb_index_stats，建一张测试表做说明：

CREATE TABLE t1 (

 a INT, b INT, c INT, d INT, e INT, f INT,

 PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)

) ENGINE=INNODB;
        
          
        
        
        
          
          AI 代码解读

写入数据如下：

401f913d8be4bbb21bedf37ae3822d1f47cc15c2

查看t1表的统计信息，需主要关注stat_name和stat_value字段

e0efc871a8bd40e1ee14f8ec31de5ba3306539fd

stat_name=size时：stat_value表示索引的页的数量

stat_name=n_leaf_pages时：stat_value表示叶子节点的数量

stat_name=n_diff_pfxNN时：stat_value表示索引字段上唯一值的数量，此处做一下具体说明：

1、n_diff_pfx01表示索引第一列distinct之后的数量，如PRIMARY的a列，只有一个值1，所以index_name='PRIMARY' and stat_name='n_diff_pfx01'时，stat_value=1。

2、n_diff_pfx02表示索引前两列distinct之后的数量，如i2uniq的e,f列，有4个值，所以index_name='i2uniq' and stat_name='n_diff_pfx02'时，stat_value=4。

3、对于非唯一索引，会在原有列之后加上主键索引，如index_name=’i1’ and stat_name=’n_diff_pfx03’，在原索引列c,d后加了主键列a，(c,d,a)的distinct结果为2。

了解了stat_name和stat_value的具体含义，就可以协助我们排查SQL执行时为什么没有使用合适的索引，例如某个索引n_diff_pfxNN的stat_value远小于实际值，查询优化器认为该索引选择度较差，就有可能导致使用错误的索引。

三、统计信息不准确的处理

我们查看执行计划，发现未使用正确的索引，如果是innodb_index_stats中统计信息差别较大引起，可通过以下方式处理：

1、手动更新统计信息，注意执行过程中会加读锁：

ANALYZETABLE TABLE_NAME;

2、如果更新后统计信息仍不准确，可考虑增加表采样的数据页，两种方式可以修改：

a) 全局变量INNODB_STATS_PERSISTENT_SAMPLE_PAGES，默认为20；

b) 单个表可以指定该表的采样：

ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;

经测试，此处STATS_SAMPLE_PAGES的最大值是65535，超出会报错。

目前MySQL并没有提供直方图的功能，某些情况下（如数据分布不均）仅仅更新统计信息不一定能得到准确的执行计划，只能通过index hint的方式指定索引。新版本8.0会增加直方图功能，让我们期待MySQL越来越强大的功能吧！

原文发布时间为：2018-01-23

本文作者：王小龙

本文来自云栖社区合作伙伴“老叶茶馆”，了解相关信息可以关注“老叶茶馆”微信公众号

MySQL统计信息简介

二、持久化统计信息

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

MySQL统计信息简介

二、持久化统计信息

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像