找到 mysql 数据库中的不良索引

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介:

为了演示,首先建两个包含不良索引的表,并弄点数据。

 
 
  1. mysql> show create table test1\G
  2. *************************** 1. row ***************************
  3. Table: test1
  4. Create Table: CREATE TABLE `test1` (
  5. `id` int(11) NOT NULL,
  6. `f1` int(11) DEFAULT NULL,
  7. `f2` int(11) DEFAULT NULL,
  8. `f3` int(11) DEFAULT NULL,
  9. PRIMARY KEY (`id`),
  10. KEY `k1` (`f1`,`id`),
  11. KEY `k2` (`id`,`f1`),
  12. KEY `k3` (`f1`),
  13. KEY `k4` (`f1`,`f3`),
  14. KEY `k5` (`f1`,`f3`,`f2`)
  15. ) ENGINE=InnoDB DEFAULT CHARSET=latin1
  16. 1 row in set (0.00 sec)
  17. mysql> show create table test2\G
  18. *************************** 1. row ***************************
  19. Table: test2
  20. Create Table: CREATE TABLE `test2` (
  21. `id1` int(11) NOT NULL DEFAULT '0',
  22. `id2` int(11) NOT NULL DEFAULT '0',
  23. `b` int(11) DEFAULT NULL,
  24. PRIMARY KEY (`id1`,`id2`),
  25. KEY `k1` (`b`)
  26. ) ENGINE=InnoDB DEFAULT CHARSET=latin1
  27. 1 row in set (0.00 sec)
  28. mysql> select count(*) from test2 group by b;
  29. +----------+
  30. | count(*) |
  31. +----------+
  32. | 32 |
  33. | 17 |
  34. +----------+
  35. 2 rows in set (0.00 sec)
AI 代码解读

1. 包含主键的索引

innodb 本身是聚簇表,每个二级索引本身就包含主键,类似 f1, id 的索引实际虽然没有害处,但反映了使用者对 mysql 索引不了解。而类似 id, f1 的是多余索引,会浪费存储空间,并影响数据更新性能。包含主键的索引用这样一句 sql 就能全部找出来。

 
 
  1. mysql> select c.*, pk from
  2. -> (select table_schema, table_name, index_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') cols
  3. -> from INFORMATION_SCHEMA.STATISTICS
  4. -> where index_name != 'PRIMARY' and table_schema != 'mysql'
  5. -> group by table_schema, table_name, index_name) c,
  6. -> (select table_schema, table_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') pk
  7. -> from INFORMATION_SCHEMA.STATISTICS
  8. -> where index_name = 'PRIMARY' and table_schema != 'mysql'
  9. -> group by table_schema, table_name) p
  10. -> where c.table_name = p.table_name and c.table_schema = p.table_schema and c.cols like concat('%', pk, '%');
  11. +--------------+------------+------------+---------+------+
  12. | table_schema | table_name | index_name | cols | pk |
  13. +--------------+------------+------------+---------+------+
  14. | test | test1 | k1 | |f1|id| | |id| |
  15. | test | test1 | k2 | |id|f1| | |id| |
  16. +--------------+------------+------------+---------+------+
  17. 2 rows in set (0.04 sec)
AI 代码解读

2. 重复索引前缀

包含重复前缀的索引,索引能由另一个包含该前缀的索引完全代替,是多余索引。多余的索引会浪费存储空间,并影响数据更新性能。这样的索引同样用一句 sql 可以找出来。

 
 
  1. mysql> select c1.table_schema, c1.table_name, c1.index_name,c1.cols,c2.index_name, c2.cols from
  2. -> (select table_schema, table_name, index_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') cols
  3. -> from INFORMATION_SCHEMA.STATISTICS
  4. -> where table_schema != 'mysql' and index_name!='PRIMARY'
  5. -> group by table_schema,table_name,index_name) c1,
  6. -> (select table_schema, table_name,index_name, concat('|', group_concat(column_name order by seq_in_index separator '|'), '|') cols
  7. -> from INFORMATION_SCHEMA.STATISTICS
  8. -> where table_schema != 'mysql' and index_name != 'PRIMARY'
  9. -> group by table_schema, table_name, index_name) c2
  10. -> where c1.table_name = c2.table_name and c1.table_schema = c2.table_schema and c1.cols like concat(c2.cols, '%') and c1.index_name != c2.index_name;
  11. +--------------+------------+------------+------------+------------+---------+
  12. | table_schema | table_name | index_name | cols | index_name | cols |
  13. +--------------+------------+------------+------------+------------+---------+
  14. | test | test1 | k1 | |f1|id| | k3 | |f1| |
  15. | test | test1 | k4 | |f1|f3| | k3 | |f1| |
  16. | test | test1 | k5 | |f1|f3|f2| | k3 | |f1| |
  17. | test | test1 | k5 | |f1|f3|f2| | k4 | |f1|f3| |
  18. +--------------+------------+------------+------------+------------+---------+
  19. 4 rows in set (0.02 sec)
AI 代码解读

3. 低区分度索引

这样的索引由于仍然会扫描大量记录,在实际查询时通常会被忽略。但是在某些情况下仍然是有用的。因此需要根据实际情况进一步分析。这里是区分度小于 10% 的索引,可以根据需要调整参数。

 
 
  1. mysql> select p.table_schema, p.table_name, c.index_name, c.car, p.car total from
  2. -> (select table_schema, table_name, index_name, max(cardinality) car
  3. -> from INFORMATION_SCHEMA.STATISTICS
  4. -> where index_name != 'PRIMARY'
  5. -> group by table_schema, table_name,index_name) c,
  6. -> (select table_schema, table_name, max(cardinality) car
  7. -> from INFORMATION_SCHEMA.STATISTICS
  8. -> where index_name = 'PRIMARY' and table_schema != 'mysql'
  9. -> group by table_schema,table_name) p
  10. -> where c.table_name = p.table_name and c.table_schema = p.table_schema and p.car > 0 and c.car / p.car < 0.1;
  11. +--------------+------------+------------+------+-------+
  12. | table_schema | table_name | index_name | car | total |
  13. +--------------+------------+------------+------+-------+
  14. | test | test2 | k1 | 4 | 49 |
  15. +--------------+------------+------------+------+-------+
  16. 1 row in set (0.04 sec)
AI 代码解读

4. 复合主键

由于 innodb 是聚簇表,每个二级索引都会包含主键值。复合主键会造成二级索引庞大,而影响二级索引查询性能,并影响更新性能。同样需要根据实际情况进一步分析。

 
 
  1. mysql> select table_schema, table_name, group_concat(column_name order by seq_in_index separator ',') cols, max(seq_in_index) len
  2. -> from INFORMATION_SCHEMA.STATISTICS
  3. -> where index_name = 'PRIMARY' and table_schema != 'mysql'
  4. -> group by table_schema, table_name having len>1;
  5. +--------------+------------+-----------------------------------+------+
  6. | table_schema | table_name | cols | len |
  7. +--------------+------------+-----------------------------------+------+
  8. | test | test2 | id1,id2 | 2 |
  9. +--------------+------------+-----------------------------------+------+
  10. 1 rows in set (0.01 sec)
  11. 本文来自云栖社区合作伙伴“Linux中国”,原文发布日期:2015-08-18
AI 代码解读
相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
176
分享
相关文章
Mysql的索引
MYSQL索引主要有 : 单列索引 , 组合索引和空间索引 , 用的比较多的就是单列索引和组合索引 , 空间索引我这边没有用到过 单列索引 : 在MYSQL数据库表的某一列上面创建的索引叫单列索引 , 单列索引又分为 ● 普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点。 ● 唯一索引:索引列中的值必须是唯一的,但是允许为空值 ● 主键索引:是一种特殊的唯一索引,不允许有空值 ● 全文索引: 只有在MyISAM引擎、InnoDB(5.6以后)上才能使⽤用,而且只能在CHAR,VARCHAR,TEXT类型字段上使⽤用全⽂文索引。
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
【YashanDB知识库】原生mysql驱动配置连接崖山数据库
docker拉取MySQL后数据库连接失败解决方案
通过以上方法,可以解决Docker中拉取MySQL镜像后数据库连接失败的常见问题。关键步骤包括确保容器正确启动、配置正确的环境变量、合理设置网络和权限,以及检查主机防火墙设置等。通过逐步排查,可以快速定位并解决连接问题,确保MySQL服务的正常使用。
232 82
数据库索引采用B+树不采用B树的原因?
● B+树更便于遍历:由于B+树的数据都存储在叶子结点中,分支结点均为索引,方便扫库,只需要扫一遍叶子结点即可,但是B树因为其分支结点同样存储着数据,我们要找到具体的数据,需要进行一次中序遍历按序来扫,所以B+树更加适合在区间查询的情况,所以通常B+树用于数据库索引。 ● B+树的磁盘读写代价更低:B+树在内部节点上不包含数据信息,因此在内存页中能够存放更多的key。 数据存放的更加紧密,具有更好的空间局部性。因此访问叶子节点上关联的数据也具有更好的缓存命中率。 ● B+树的查询效率更加稳定:由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条
MySQL索引有哪些类型?
● 普通索引:最基本的索引,没有任何限制。 ● 唯一索引:索引列的值必须唯一,但可以有空值。可以创建组合索引,则列值的组合必须唯一。 ● 主键索引:是特殊的唯一索引,不可以有空值,且表中只存在一个该值。 ● 组合索引:多列值组成一个索引,用于组合搜索,效率高于索引合并。 ● 全文索引:对文本的内容进行分词,进行搜索。
缓存与数据库的一致性方案,Redis与Mysql一致性方案,大厂P8的终极方案(图解+秒懂+史上最全)
缓存与数据库的一致性方案,Redis与Mysql一致性方案,大厂P8的终极方案(图解+秒懂+史上最全)
MySQL生产环境迁移至YashanDB数据库深度体验
这篇文章是作者将 MySQL 生产环境迁移至 YashanDB 数据库的深度体验。介绍了 YashanDB 迁移平台 YMP 的产品相关信息、安装步骤、迁移中遇到的各种兼容问题及解决方案,最后总结了迁移体验,包括工具部署和操作特点,也指出功能有优化空间及暂不支持的部分,期待其不断优化。
云数据库:从零到一,构建高可用MySQL集群
在互联网时代,数据成为企业核心资产,传统单机数据库难以满足高并发、高可用需求。云数据库通过弹性扩展、分布式架构等优势解决了这些问题,但也面临数据安全和性能优化挑战。本文介绍了如何从零开始构建高可用MySQL集群,涵盖选择云服务提供商、创建实例、配置高可用架构、数据备份恢复及性能优化等内容,并通过电商平台案例展示了具体应用。
从 MySQL 到时序数据库 TDengine:Zendure 如何实现高效储能数据管理?
TDengine 助力广州疆海科技有限公司高效完成储能业务的数据分析任务,轻松应对海量功率、电能及输入输出数据的实时统计与分析,并以接近 1 : 20 的数据文件压缩率大幅降低存储成本。此外,taosX 强大的 transform 功能帮助用户完成原始数据的清洗和结构优化,而其零代码迁移能力更实现了历史数据从 TDengine OSS 与 MySQL 到 TDengine 企业版的平滑迁移,全面提升了企业的数据管理效率。本文将详细解读这一实践案例。
37 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等