MySQL日志分析工具-阿里云开发者社区

MySQL日志分析工具

2017-11-26 2170

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL，集群系列 2核4GB

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

日志服务 SLS，月写入数据量 50GB 1个月

简介：

MySQL的性能从查看日志开始。硬件配置低常常导致这样的问题，但事实上大多数情况并不在这里。某些“慢"SQL阻塞了其他语句的执行，优化查询是第一步需要做的。

“工欲善其事必先利其器”，MySQL自身的一款mysqldumpslow 查询日志分析器，该工具不但陈旧，验证规范不准确。今天要说的是Percona 的工具pt-query-digest,它能够分析慢查询日志内容，生成查询报告，过滤，重放或传送一些查询语句至MySQL,PostgreSQL,memcached或者其他。

基本语法：pt-query-digest [OPTION...] [FILE]

pt-query-digest [OPTION...] [FILE]

缺点：对系统资源开销较大（可以将慢查询日志拷贝至其他地方分析）

举例1（在测试库中进行）、

     pt-query-digest /usr/local/mysql3307/data/slow_my3307.log
# 120.6s user time, 1.4s system time, 59.63M rss, 103.21M vsz
# Current date: Fri Aug  3 12:21:26 2012
# Hostname: XXXX
# Files: /usr/local/mysql3307/data/slow_my3307.log
# Overall: 515.52k total, 240 unique, 0.12 QPS, 0.00x concurrency ________
# Time range: 2012-06-14 06:41:25 to 2012-08-03 12:21:26
# Attribute          total     min     max     avg     95%  stddev  median
# ============     ======= ======= ======= ======= ======= ======= =======

# Exec time          4742s    64us     16s     9ms    40ms    35ms   287us
# Lock time            20s    13us    98ms    38us    49us   370us    23us
# Rows sent          5.22M       0   1.10k   10.62   51.63   54.93    0.99
# Rows examine       8.29G       0 101.66k  16.86k  97.04k  33.18k  964.41
# Query size        32.28M      24     930   65.66  107.34   35.79   34.95

部分解释如下：

第一行表示分析该日志所使用的时间。该文件中一共拥有515.52k慢查询（测试的情况稍稍多了点。。），其中有240个完全不同类型的查询，在该时间段内每秒处理的查询数量：0.12（关于区别完全不同的查询稍后讨论）

接下来是：

比较严重SQL的分析部分：

# Profile
# Rank Query ID           Response time   Calls  R/Call Apdx V/M   Item
# ==== ================== =============== ====== ====== ==== ===== =======
#    1 0xF32359E9A4679928 2680.8630 56.5% 116551 0.0230 1.00  0.05 SELECT user_bloods
#    2 0xB05F93CEB2DED5F5 1908.3559 40.2%  62714 0.0304 1.00  0.00 SELECT user_bloods
#    4 0x85E98D19B3A42237   28.8959  0.6%     12 2.4080 0.83 11.49 SELECT appfuse.titems
# MISC 0xMISC              123.5087  2.6% 336240 0.0004   NS   0.0 <237 ITEMS>

其中挑出最为严重的 4个SQL语句，（可以通过参数 --limit 进行设置）它所有语句响应时间总和，调用比例，查询类型等

接下来是单个语句的分析：

String:
# Databases    YYY
# Hosts
# Users        XXX
# Query_time distribution
#   1us
#  10us
# 100us  ################################################################
#   1ms
#  10ms
# 100ms
#    1s  ########################
#  10s+  ########

可以看到在在数据库YYY中用户XX 利用该语句查询的响应时间分布图，10S+ 还是很多的。

最后是分析情况：

# Tables
#    SHOW TABLE STATUS FROM `YYY` LIKE 'titems'\G
#    SHOW CREATE TABLE `ZZZ`.`titems`\G
# EXPLAIN /*!50100 PARTITIONS*/
select * from `ZZZ`.`titems`  limit 0,1000\G

# 号部分是分析步骤，最后语句可以再前面加上 explain 进行复制，进一步分析。

举例二：

--review 参数

该参数可以讲分析结果保存在某个数据表中，这样我们可以为查询做出标记，并且当第二次加上 --review 时，如果存在相同的语句分析，就不会记录到数据表中，

表结构如下：

   pt-query-digest  -P 3307 -u root --password='XXXXXX' --review h=localhost,D=test,t=store --limit 5 /usr/local/mysql3307/data/slow_my3307.log

CREATE TABLE query_review (

   checksumBIGINTUNSIGNEDNOTNULLPRIMARYKEY,fingerprintTEXTNOTNULL,sampleTEXTNOTNULL,first_seenDATETIME,last_seenDATETIME,reviewed_byVARCHAR(20),reviewed_onDATETIME,commentsTEXT)

checksum 一个64位校验码对应于finigerprint

举例：

      checksum: 16449492566044263938
fingerprint: select id from user_bloods where user_id = ? and monster_family_id = ? order by updated_at desc
     sample: select id from user_bloods where user_id = 48124 and monster_family_id = 2 order by updated_at desc
 first_seen: 2012-06-14 07:31:28
  last_seen: 2012-08-03 10:44:32
reviewed_by: NULL
reviewed_on: NULL
   comments: NULL

举例三：

只收集：select 语句，并将其应用于其他的MySQLserver，并分析出耗时最长的SQL:

  pt-query-digest   /usr/local/mysql3307/data/slow_my3307.log --execute h=localhost -u root --password='mj20100913' --filter '$event->{fingerprint} =~ m/^select/'

(这个可以讲线上的日志分析出来，并应用于测试的服务器上，模仿线上的真是环境)

举例四：

将processlist 收集出来并输出到其他文件：

    pt-query-digest --processlist h=localhost -u root --password='XXXXX' --print --no-report

（这个默认是每秒进行一次连接并记录，可设置，如果连接失败会等待1秒在继续连接）

所有参数可以通过--help看到。

本文未详细解释参数信息，并未列出memcached 地址（详细看这里：http://code.google.com/p/maatkit/wiki/EventAttributes），有兴趣的话大家可以参考官方文档：http://www.percona.com/doc/percona-toolkit/2.1/pt-query-digest.html#cmdoption-pt-query-digest--interval

本文转自位鹏飞 51CTO博客，原文链接http://blog.51cto.com/weipengfei/953075，如需转载请自行联系原作者

MySQL日志分析工具

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

MySQL日志分析工具

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像