MySQL之SQL分析三部曲

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云数据库 RDS MySQL Serverless,价值2615元额度,1个月
简介: 在倒腾DB的时候,SQL会占据非常大的一部分时间,遇到执行效率不高的SQL时,就需要想办法找到执行效率不高的原因,这里简单记录分析SQL的三个步骤~使用的数据库版本为MySQL-5.
在倒腾DB的时候,SQL会占据非常大的一部分时间,遇到执行效率不高的SQL时,就需要想办法找到执行效率不高的原因,这里简单记录分析SQL的三个步骤~

使用的数据库版本为MySQL-5.7.7-rc

-----------------------------------------------------------------------------------------正文------------------------------------------------------------------------------------------

Step1,使用explain or explain extended来查看MySQL的执行计划,
extended在后续的版本会被取消,所以加不加没什么太大的关系,因为在MySQL-5.7.7-rc里面,普通的explain已经有filter了,
个人理解:filter当做是过滤百分比,大体上就是找到最终结果需要扫描多少数据,基本上,低一些会比较好。
explain在网上有很多的介绍,这理解略过吧,基本上,在Extra列里面,尽可能不要出现Use Temporary Table 和 Using file sort,相比较而言,使用临时表的影响更大,file sort会小一些。

为什么SQL的分析不在这里就打住了?
原因很简单,MySQL在优化查询的时候是只用一个索引的,所以在有些情况下,SQL查询既存在排序,又存在比较复杂的where条件,那么到底是用索引提高where条件的筛选效率?还是用索引去省掉排序的开销?(优化器?MySQL的查询优化器出了名的拙计,而且除了优化器本身的一切缺陷导致Cost计算不准确以外,MySQL本身也会根据一些参数的设置去调整优化器的策略,而这些参数大多数时候我们并不了解)

Step2,当explain搞不定的时候,就需要profile来帮忙了,这个东西可以详细的列出在每一个步骤消耗的时间,前提是先执行一遍语句。
profile默认是关闭的,所以需要在client先打开,操作如下图

在实际的生产环境中,可能会需要加大profile的队列,保证想要查看的语句耗时结果还保存着,所以可以用如下操作来增加profile的队列大小


到这一步,profile的功能就已经打开了,这里简单试一下SQL语句,explain一下



显然这种语句是不合格的,那么在优化前,可以看看这条语句的耗时,先执行以下select,然后show profiles查看队列的内容,



可以看到ID为7的那一行正式执行过的语句,这时候使用show profile block io,cpu for query 7来查看统计信息(红色为常用选项,可以不加的~)



红色方框标出来了两行内容,Creating sort index消耗了接近99%的时间,说明这个查询的大部分时间消耗在了排序阶段
Sending data标出来是要特别注意一下,并不只是在服务器端和客户端之间sending data,还包括了从磁盘读取数据的时间,所以对大表执行全表扫描or索引的效率不高时,这个时间会比较高
找到了主要耗时的部分,那么就建立一个索引,再来看看profile的数据

然而即便是analyze table以后,优化器依然不选择走索引,而是坚持全表扫描来执行这个语句,所以profile看了也没什么用,和之前的数据应该是差不多的, 那么为什么优化器不选择走索

Step3 Optimizer trace
Optimizer trace是MySQL5.6添加的新功能,可以看到大量的内部查询计划产生的信息,可以用如下方式打开

然后在information_chema.optimizer_trace的表里面查找这一条语句对应的信息

内容是json格式的,所以推荐找一个json的转换工具来辅助查看,这个json主要分为三个部分


有关执行计划的选择,主要在第二部分里面


那么可以看看这两个分支的内容

在这里面能看到详细的统计信息,包括cost,预计的rows,以及查询优化器最终的选择chosen,发现在考虑排序的影响时,并没有使用索引(index:“unknown”)
即便是加了use index,但是在Optimize trace里面依然选择了使用全表扫描,而使用了索引并没有什么优化到file sort,因为使用use index指定的index被放在了range index的考虑范围内
因为并没有读源码的计划所以只能是做出推测:在有where条件的前提下,MySQL优化器并不会为order by 专门去计算一次cost,因为扫描这个索引并不会对where条件的行筛选有任何的帮助,到头来还是只能全表扫描,筛选出符合条件的行;如果非要用index.column,反而还要根据行标记回头去读取index的内容选出需要的数据,再重新来获得有序的行标记,本末倒置了。(_(:з」∠)_看起来有理有据让人信服的推断)


那么有什么办法能让file sort利用上索引么?
答案是:
用联合索引把where筛选条件的那些列和order by 的列全部包含进去....(对于这个例子并不推荐,因为联合索引的列数量偏多;除非这种查询的数量极多)
输出信息分为两个部分,

从这一部分可以看到,MySQL内部把=的操作全部换成了range,也计算了使用索引和全表扫描的cost,(用上了新的索引,意料之中)
下一部分可以看到最终决定的执行计划,以及order by阶段索引的使用情况



--------------------------------------------------------------------------稍显凌乱的博客的结尾处---------------------------------------------------------------------------

总结:explain可以应对大多数的状况;show profile可以帮我们更好的分析SQL优化的主要目标,是锁?还是磁盘读写?还是文件排序?等等...;而最后的optimize_trace则适合于各种疑难杂症了,比如说优化器为什么没有选择索引而是全表扫描?为什么优化器没有选择效率较好的索引,而是选择了一个效率较差的索引(order by)?等等乱七八糟的奇怪现象.....
相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2天前
|
SQL 关系型数据库 MySQL
【MySQL系列笔记】常用SQL
常用SQL分为三种类型,分别为DDL,DML和DQL;这三种类型的SQL语句分别用于管理数据库结构、操作数据、以及查询数据,是数据库操作中最常用的语句类型。 在后面学习的多表联查中,SQL是分析业务后业务后能否实现的基础,以及后面如何书写动态SQL,以及完成级联查询的关键。
18 6
|
2天前
|
SQL 关系型数据库 MySQL
【MySQL-4】简述SQLの通用语法及4种基本语句介绍(DDL/DML/DQL/DCL)
【MySQL-4】简述SQLの通用语法及4种基本语句介绍(DDL/DML/DQL/DCL)
|
2天前
|
SQL 存储 关系型数据库
【MySQL系列笔记】SQL优化
SQL优化是通过调整数据库查询、索引、表结构和配置参数等方式,提高SQL查询性能和效率的过程。它旨在减少查询执行时间、减少系统资源消耗,从而提升数据库系统整体性能。优化方法包括索引优化、查询重写、表分区、适当选择和调整数据库引擎等。
19 3
|
4天前
|
SQL 关系型数据库 MySQL
MySQL SQL error: #1271 - Illegal mix of collations for operation ‘UNION‘
MySQL SQL error: #1271 - Illegal mix of collations for operation ‘UNION‘
|
22天前
|
SQL 安全 算法
【SQL server】玩转SQL server数据库:第四章 数据库安全性
【SQL server】玩转SQL server数据库:第四章 数据库安全性
65 12
|
22天前
|
SQL 人工智能 算法
【SQL server】玩转SQL server数据库:第二章 关系数据库
【SQL server】玩转SQL server数据库:第二章 关系数据库
61 10
|
22天前
|
SQL 存储 算法
【SQL server】玩转SQL server数据库:第一章 绪论
【SQL server】玩转SQL server数据库:第一章 绪论
42 5
|
22天前
|
SQL 数据库 数据库管理
【SQL server】玩转SQL server数据库:第三章 关系数据库标准语言SQL(一)模式、表、索引与视图
【SQL server】玩转SQL server数据库:第三章 关系数据库标准语言SQL(一)模式、表、索引与视图
55 11
|
5天前
|
SQL 数据可视化 算法
SQL Server聚类数据挖掘信用卡客户可视化分析
SQL Server聚类数据挖掘信用卡客户可视化分析
14 2
|
22天前
|
SQL 算法 数据库
【SQL server】玩转SQL server数据库:第三章 关系数据库标准语言SQL(二)数据查询
【SQL server】玩转SQL server数据库:第三章 关系数据库标准语言SQL(二)数据查询
97 6