MySQL性能管理及架构设计（三）：SQL查询优化、分库分表 - 完结篇

2018-09-19 2616

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

日志服务 SLS，月写入数据量 50GB 1个月

简介：

一、SQL查询优化（`重要`）

1.1 获取有性能问题SQL的三种方式

通过用户反馈获取存在性能问题的SQL；
通过慢查日志获取存在性能问题的SQL；
实时获取存在性能问题的SQL；

1.1.2 慢查日志分析工具

相关配置参数：

slow_query_log # 启动停止记录慢查日志，慢查询日志默认是没有开启的可以在配置文件中开启(on)slow_query_log_file # 指定慢查日志的存储路径及文件，日志存储和数据从存储应该分开存储long_query_time # 指定记录慢查询日志SQL执行时间的阀值默认值为10秒通常,对于一个繁忙的系统来说,改为0.001秒(1毫秒)比较合适log_queries_not_using_indexes #是否记录未使用索引的SQL
        
          
        
        
        
          
          AI 代码解读

常用工具：mysqldumpslow和pt-query-digest

pt-query-digest --explain h=127.0.0.1,u=root,p=p@ssWord slow-mysql.log
        
          
        
        
        
          
          AI 代码解读

1.1.3 实时获取有性能问题的SQL（推荐）

559b925ff63530fabf879a1b51a932b35f19ac93

SELECT id,user,host,DB,command,time,state,infoFROM information_schema.processlistWHERE TIME>=60
        
          
        
        
        
          
          AI 代码解读

查询当前服务器执行超过60s的SQL，可以通过脚本周期性的来执行这条SQL，就能查出有问题的SQL。

1.2 SQL的解析预处理及生成执行计划（`重要`）

1.2.1 查询过程描述（`重点！！！`）

6834c773ec7f48f14755d20b7f65f03933411327

通过上图可以清晰的了解到MySql查询执行的大致过程：

发送SQL语句。
查询缓存，如果命中缓存直接返回结果。
SQL解析，预处理，再由优化器生成对应的查询执行计划。
执行查询，调用存储引擎API获取数据。
返回结果。

1.2.2 查询缓存对性能的影响（建议关闭缓存）

第一阶段：
相关配置参数：

query_cache_type # 设置查询缓存是否可用query_cache_size # 设置查询缓存的内存大小query_cache_limit # 设置查询缓存可用的存储最大值（加上sql_no_cache可以提高效率）query_cache_wlock_invalidate # 设置数据表被锁后是否返回缓存中的数据query_cache_min_res_unit # 设置查询缓存分配的内存块的最小单
        
          
        
        
        
          
          AI 代码解读

缓存查找是利用对大小写敏感的哈希查找来实现的，Hash查找只能进行全值查找（sql完全一致），如果缓存命中，检查用户权限，如果权限允许，直接返回，查询不被解析，也不会生成查询计划。

`在一个读写比较频繁的系统中，建议关闭缓存，因为缓存更新会加锁`。将`query_cache_type`设置为`off`,`query_cache_size`设置为`0`。

1.2.3 第二阶段：MySQL依照执行计划和存储引擎进行交互

这个阶段包括了多个子过程：

d12c547b434b9fdfe47ecd0872ffe9679c558ac8

一条查询可以有多种查询方式，查询优化器会对每一种查询方式的（存储引擎）统计信息进行比较，找到成本最低的查询方式，这也就是索引不能太多的原因。

1.3 会造成MySQL生成错误的执行计划的原因

1、统计信息不准确
2、成本估算与实际的执行计划成本不同

a7c307c09905286a78beda8cbac92e428025e625

3、给出的最优执行计划与估计的不同

5c70589fbf2547616ac66a285c3a6666c13da8d0

4、MySQL不考虑并发查询

5、会基于固定规则生成执行计划

6、MySQL不考虑不受其控制的成本，如存储过程，用户自定义函数

1.4 MySQL优化器可优化的SQL类型

查询优化器：对查询进行优化并查询mysql认为的成本最低的执行计划。为了生成最优的执行计划，查询优化器会对一些查询进行改写

可以优化的sql类型

1、重新定义表的关联顺序；

9086a814f6ffb2aff6786c5c36e4a06aa629d269

2、将外连接转换为内连接；

3、使用等价变换规则；

be42c85cf05bc4f5dd9a5f5d5c391a6d27aa6c2f

4、优化count(),min(),max()；

bf5f8ba5a825f7e84875565b398b89a62bc19559

5、将一个表达式转换为常数；

6、子查询优化；

0da9d9bc5a91496f722cb603ccc379b8133e01bd

7、提前终止查询，如发现一个不成立条件(如where id = -1)，立即返回一个空结果；

8、对in()条件进行优化；

1.5 查询处理各个阶段所需要的时间

1.5.1 使用profile(目前已经不推荐使用了)

set profiling = 1; #启动profile,这是一个session级的配制执行查询show profiles; # 查询每一个查询所消耗的总时间的信息show profiles for query N; # 查询的每个阶段所消耗的时间
        
          
        
        
        
          
          AI 代码解读

1.5.2 performance_schema是5.5引入的一个性能分析引擎（5.5版本时期开销比较大）

启动监控和历史记录表：use performance_schema

update setup_instruments set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'stage%';update set_consumbers set enabled='YES',TIME = 'YES' WHERE NAME LIKE 'event%';
        
          
        
        
        
          
          AI 代码解读

c083a1a4e20aeebe0266a606810da2b026021a1a

1.6 特定SQL的查询优化

1.6.1 大表的数据修改

3ae447660cbaf33c2b849e1cb24253b52ec5ac2a

1.6.2 大表的结构修改

50a0de3e8d4dfa6dba45d38b7c38d26dae40cdd2

利用主从复制，先对从服务器进入修改，然后主从切换
（推荐）

添加一个新表（修改后的结构），老表数据导入新表，老表建立触发器，修改数据同步到新表，老表加一个排它锁（重命名），新表重命名，删除老表。

b9e43625bb84de720ba2870c32ca6c79128a5b82

修改语句这个样子：

alter table sbtest4 modify c varchar(150) not null default ''
        
          
        
        
        
          
          AI 代码解读

利用工具修改：

f371846c5e50c84bb9ba5b947df0ee96df86a5cc

1.6.3 优化not in 和 <> 查询

子查询改写为关联查询：

74637baace7c94807d624b161fe9be6fd3f7b6ef

二、分库分表

2.1 分库分表的几种方式

分担读负载可通过一主多从，升级硬件来解决。

2.1.1 把一个实例中的多个数据库拆分到不同实例（集群）

7c37174f9df50e01f6ffa531e1e28e89aa84126b

拆分简单,不允许跨库。但并不能减少写负载。

2.1.2 把一个库中的表分离到不同的数据库中

ecd6d2916fb3a2ebb878ba89700e0fd2c666716e

该方式只能在一定时间内减少写压力。

以上两种方式只能暂时解决读写性能问题。

2.1.3 数据库分片

对一个库中的相关表进行水平拆分到不同实例的数据库中

a1285f738d1c3b05f6eafd3cab065c6250be0b7e

2.1.3.1 如何选择分区键

分区键要能尽可能避免跨分区查询的发生
分区键要尽可能使各个分区中的数据平均

2.1.3.2 分片中如何生成全局唯一ID

6d32b717b1094888115e049fb48fb0d02951154e

扩展：表的垂直拆分和水平拆分

原文发布时间为：2018-09-19

本文作者：唐成勇

本文来自云栖社区合作伙伴“云时代架构”，了解相关信息可以关注“云时代架构”。

MySQL性能管理及架构设计（三）：SQL查询优化、分库分表 - 完结篇

一、SQL查询优化（`重要`）

1.1 获取有性能问题SQL的三种方式

1.1.2 慢查日志分析工具

1.1.3 实时获取有性能问题的SQL（推荐）

1.2 SQL的解析预处理及生成执行计划（`重要`）

1.2.1 查询过程描述（`重点！！！`）

通过上图可以清晰的了解到MySql查询执行的大致过程：

1.2.2 查询缓存对性能的影响（建议关闭缓存）

`在一个读写比较频繁的系统中，建议关闭缓存，因为缓存更新会加锁`。将`query_cache_type`设置为`off`,`query_cache_size`设置为`0`。

1.2.3 第二阶段：MySQL依照执行计划和存储引擎进行交互

1.3 会造成MySQL生成错误的执行计划的原因

1.4 MySQL优化器可优化的SQL类型

1.5 查询处理各个阶段所需要的时间

1.5.1 使用profile(目前已经不推荐使用了)

1.5.2 performance_schema是5.5引入的一个性能分析引擎（5.5版本时期开销比较大）

1.6.1 大表的数据修改

1.6.2 大表的结构修改

1.6.3 优化not in 和 <> 查询

2.1 分库分表的几种方式

2.1.1 把一个实例中的多个数据库拆分到不同实例（集群）

2.1.2 把一个库中的表分离到不同的数据库中

2.1.3 数据库分片

2.1.3.1 如何选择分区键

2.1.3.2 分片中如何生成全局唯一ID

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

MySQL性能管理及架构设计（三）：SQL查询优化、分库分表 - 完结篇

一、SQL查询优化（重要）

1.1 获取有性能问题SQL的三种方式

1.1.2 慢查日志分析工具

1.1.3 实时获取有性能问题的SQL（推荐）

1.2 SQL的解析预处理及生成执行计划（重要）

1.2.1 查询过程描述（重点！！！）

通过上图可以清晰的了解到MySql查询执行的大致过程：

1.2.2 查询缓存对性能的影响（建议关闭缓存）

在一个读写比较频繁的系统中，建议关闭缓存，因为缓存更新会加锁。将query_cache_type设置为off,query_cache_size设置为0。

1.2.3 第二阶段：MySQL依照执行计划和存储引擎进行交互

1.3 会造成MySQL生成错误的执行计划的原因

1.4 MySQL优化器可优化的SQL类型

1.5 查询处理各个阶段所需要的时间

1.5.1 使用profile(目前已经不推荐使用了)

1.5.2 performance_schema是5.5引入的一个性能分析引擎（5.5版本时期开销比较大）

1.6.1 大表的数据修改

1.6.2 大表的结构修改

1.6.3 优化not in 和 <> 查询

2.1 分库分表的几种方式

2.1.1 把一个实例中的多个数据库拆分到不同实例（集群）

2.1.2 把一个库中的表分离到不同的数据库中

2.1.3 数据库分片

2.1.3.1 如何选择分区键

2.1.3.2 分片中如何生成全局唯一ID

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

一、SQL查询优化（`重要`）

1.2 SQL的解析预处理及生成执行计划（`重要`）

1.2.1 查询过程描述（`重点！！！`）

`在一个读写比较频繁的系统中，建议关闭缓存，因为缓存更新会加锁`。将`query_cache_type`设置为`off`,`query_cache_size`设置为`0`。