Mysql 高负载排查思路

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介:

Mysql 高负载排查思路 


发现问题 
top命令 查看服务器负载,发现 mysql竟然百分之两百的cpu,引起Mysql 负载这么高的原因,估计是索引问题和某些变态SQL语句. 

排查思路 
1. 确定高负载的类型,top命令看负载高是CPU还是IO。 
2. mysql 下执行查看当前的连接数与执行的sql 语句。 
3. 检查慢查询日志,可能是慢查询引起负载高。 
4. 检查硬件问题,是否磁盘故障问题造成的。 
5. 检查监控平台,对比此机器不同时间的负载。 

确定负载类型(top)

 
  1. top - 10:14:18 up 23 days, 11:01,  1 user, load average: 124.17, 55.88, 24.70 
  2. Tasks: 138 total,   1 running, 137 sleeping,   0 stopped,   0 zombie 
  3. Cpu(s):  2.4%us,  1.0%sy,  0.0%ni, 95.2%id,  2.0%wa,  0.1%hi,  0.2%si,  0.0%st 
  4. Mem:   3090528k total,  2965772k used,   124756k free,    93332k buffers 
  5. Swap:  4192956k total,  2425132k used,  1767824k free,   756524k cached 
  6.            
  7. PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND 
  8. 30833 mysql     15   0 6250m 2.5g 4076 S 257.1 49.9 529:34.45 mysqld  


查看当前的连接数与执行的sql 语句

 
  1. show processlist; 
  2. Id  User    Host    db  Command Time    State   Info 
  3. 192 slave   8.8.8.142:39820 NULL    Binlog Dump 58982   Has sent all binlog to slave; waiting for binlog to be updated  NULL 
  4. 194 slave   8.8.8.120:41075 NULL    Binlog Dump 58982   Has sent all binlog to slave; waiting for binlog to be updated  NULL 
  5. 424891 biotherm    8.8.8.46:57861  biotherm    Query   493 Sending data    SELECT * FROM xxx_list WHERE tid = '1112'  AND del = 0  ORDER BY  id 
  6. DESC  LIMIT 0, 4 
  7. 424917 biotherm    8.8.8.49:50984  biotherm    Query   488 Sending data    SELECT * FROM xxx_list WHERE tid = '1112'  AND del = 0  ORDER BY  id 
  8. DESC  LIMIT 0, 4 
  9. .............................................. 
  10. 430330 biotherm    8.8.8.42:35982  biotherm    Query   487 Sending data    SELECT * FROM xxx_list WHERE tid = '1112'  AND del = 0  


记录慢查询 
编辑Mysql 配置文件(my.cnf),在[mysqld]字段添加以下几行:

 
  1. log_slow_queries = /usr/local/mysql/var/slow_queries.log   #慢查询日志路径 
  2. long_query_time = 10                                       #记录SQL查询超过10s的语句 
  3. log-queries-not-using-indexes = 1                          #记录没有使用索引的sql 


查看慢查询日志

 
  1. tail /usr/local/mysql/var/slow_queries.log 
  2. # Time: 130305  9:48:13 
  3. # User@Host: biotherm[biotherm] @  [8.8.8.45] 
  4. # Query_time: 1294.881407  Lock_time: 0.000179 Rows_sent: 4  Rows_examined: 1318033 
  5. SET timestamp=1363916893
  6. SELECT * FROM xxx_list WHERE tid = '11xx'  AND del = 0  ORDER BY  id DESC  LIMIT 0, 4;  

4个参数 
Query_time: 0 Lock_time: 0 Rows_sent: 1 Rows_examined: 54 
分别意思为:查询时间 锁定时间 查询结果行数 扫描行数,主要看扫描行数多的语句,然后去数据库加上对应的索引,再优化下变态的sql 语句。 

极端情况kill sql进程

 
  1. 找出占用cpu时间过长的sql,在mysql 下执行如下命令: 
  2. show processlist; 
  3. 确定后一条sql处于Query状态,且Time时间过长,锁定它的ID,执行如下命令: 
  4. kill QUERY  269815764;  

注意:杀死 sql进程,可能导致数据丢失,所以执行前要衡量数据的重要性。 

案例:索引导致的问题 

结束 
更多请: 
linux 系统运维  37275208 
vmware 虚拟化  166682360



本文转自 dongnan 51CTO博客,原文链接:http://blog.51cto.com/dngood/1150031

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
打赏
0
0
0
0
344
分享
相关文章
深入探讨MySQL中的幻读现象:原因、影响及解决方案
**导言:** 在数据库领域中,幻读(Phantom Read)是一个常见但容易被忽视的问题。它可能会导致事务的隔离级别无法满足预期,从而引发数据一致性问题。MySQL作为广泛使用的关系型数据库,也不免遇到幻读问题。本文将深入解析MySQL中的幻读现象,探讨其原因、影响以及可能的解决方案。
2005 0
如何解决 MySQL 数据库服务器 CPU 飙升的情况
大家好,我是 V 哥。当 MySQL 数据库服务器 CPU 飙升时,如何快速定位和解决问题至关重要。本文整理了一套实用的排查和优化套路,包括使用系统监控工具、分析慢查询日志、优化 SQL 查询、调整 MySQL 配置参数、优化数据库架构及检查硬件资源等步骤。通过一个电商业务系统的案例,详细展示了从问题发现到解决的全过程,帮助你有效降低 CPU 使用率,提升系统性能。关注 V 哥,掌握更多技术干货。
275 0
《mysql慢查询追踪:动态设置与优化,一步到位解决数据库性能瓶颈》
【8月更文挑战第16天】在数据库运维中,监控与优化MySQL慢查询对提升性能至关重要。本文通过电商平台案例演示如何动态调整慢查询配置及分析过程。首先检查`long_query_time`和`slow_query_log`状态,若未开启,则需设置如`long_query_time = 2`并启动日志记录。在高并发时段收集慢查询日志后,分析发现无索引导致效率低下的查询,通过`explain`确认全表扫描,最终创建复合索引解决问题。此方法有助于快速定位并解决性能瓶颈。
641 1
MySQL死锁系列-线上死锁问题排查思路
本篇文章会讲解一下如果线上发生了死锁异常,如何去排查和处理。除了系列前文讲解的有关加锁和锁冲突的原理还,还需要对 MySQl 死锁日志和 binlog 日志进行分析。
MySQL死锁系列-线上死锁问题排查思路
优化系列 | 实例解析MySQL性能瓶颈排查定位
优化系列 | 实例解析MySQL性能瓶颈排查定位
162 0
浅谈Mysql原理与优化(七)——崩溃恢复
MySQL数据库作为一个主流数据库,对于意外宕机的情况下,数据的一致性和完整性,必须要有保障,那么具体原理是怎样的呢
516 0
浅谈Mysql原理与优化(七)——崩溃恢复
MySQL|主从延迟问题排查(二)
主库执行insert  select 批量写入操作,主从复制通过row模式下转换为批量的insert大事务操作,导致只读实例CPU资源以及延迟上涨
2413 0
MySQL|主从延迟问题排查(一)
大查询长时间执行无法释放DML读锁,后续同步主库的DDL操作获取DML写锁资源被阻塞等待,导致后续同步主库的操作堆积,主从延迟增长严重。从同步延迟的监控来看,延迟从17:11开始,17:51:59进行kill大查询操作,直到17:53建议业务方将大查询kill掉后才结束。
3401 0
MySQL|主从延迟问题排查(一)

热门文章

最新文章