基于裸数据的异地数据库性能诊断与优化

2017-11-15 7854

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 影响数据库性能的因素有很多，从大的方面可以分为硬件和软件。硬件包括CPU、内存、存储、网络设备等，软件方面包括操作系统版本、操作系统参数、数据库版本、数据库参数、数据库架构、运行的SQL代码等。以上因素中，运行的SQL代码可单独归为一类，这部分内容多变，可控性较低，与业务强关联，动态影响，难以准确捕获，问题此消彼长难以根除。

影响数据库性能的因素有很多，从大的方面可以分为硬件和软件。硬件包括CPU、内存、存储、网络设备等，软件方面包括操作系统版本、操作系统参数、数据库版本、数据库参数、数据库架构、运行的SQL代码等。

以上因素中，运行的SQL代码可单独归为一类，这部分内容多变，可控性较低，与业务强关联，动态影响，难以准确捕获，问题此消彼长难以根除。通过我们处理的故障类型统计，80%的性能问题来自于不良的SQL语句编写。

生产环境常做访问控制，管理生产环境DBA忙于日常事务无法顾及数据库性能。本文介绍一次性从生产库上获取分析性能SQL相关的数据，拿到本地环境分析诊断生产性能问题。

裸数据获取

较详细分析一个SQL的性能，需要的内容包括执行计划信息、表的基础信息、索引基础信息、SQL写法问题等等。这些内容都存放在数据字典中。

1、创建相关的表，语句参考：

3bde969dc2a52d62f5dba76a87c81b78afaac67e

注：（第三条、第四条红框处，没有* 是因为这两个视图里面有long类型，不支持create as ct操作，实际操作过程中，未获取long类型的数据，只选取了必要的列）

2、通过数据泵导出上述创建的表

3、导出AWR裸数据

$ORACLE_HOME/rdbms/admin/awrextr.sql

4、本地导入创建的表

5、通过数据泵导入AWR裸数据

$ORACLE_HOME/rdbms/admin/awrload.sql

裸数据初析

1、执行时段为10~12点，15~17点，平均执行时长超过1秒的SQL统计。多个采样期间都有执行的，取执行次数最多的采样期间。

ab5b36943cc0fc8faf5f001cd2ec193ad9a1b7af

2、执行结果部分展示如下：

64f053fb50340d9cef7a910ddad92099b8dfc52d

3、生成这获取这此SQL的SQLAWR数据脚本(取前20)

fb223b84d60e8181d85e86e55ec862608722ed2a

4、生成结果放入命令窗口执行

6826068b7c8640a5758487c79995959bbef0b7c6

注：红框为格式化操作

5、生成结果展示如下

8581b8c1d9b0af945d063baab39d2b8ccf6b722d

案例解析

NEW_TOP_PHYSICAL_16_awr_sqlrpt_dqdx4x39x2x7m.html

SQL文本

SELECT COUNT(1)
FROM GPCXXXXXXXX A
WHERE A.VALIDDATE < :B1
AND A.SUBMITDATE < :B1
AND A.SUBMITDATE >SYSDATE - 40
AND A.FEETYPE IN ('307')
AND A.PLANSTATUS = 'N'
AND ROWNUM = 1;

f59a4135195c6ed047f7a20780a233ba1e8e07c3

小时内还未执行完一次，但占用整个采样期间8.21%的物理读，并伴有严重的IO等待，对采样期间数据库整体性能有较大影响
执行计划中存在全表扫描操作
语句简单易懂

表基础信息

2493238c253cf89fe2a8c138c209f6d2cca123f2

近3亿行，未分区，平均行长149，理论占用空间大小为 296815739*149*1.17/1024/1024/1024=48G，实际占用约50G空间（从MY_DBA_SEGMENTS中获取），知此表碎片并不严重或不存在碎片。

SQL绑定变量分析

20ce40a4e7d6bd23ecd0ab02d4675fbb2f70488c

结合绑定变量和条件看，大范围上，只查询40天以内的数据。

条件列数据分布情况

14d177cd2d110b25044360fde7ea32951c93c462

回顾下SQL条件：

WHERE A.VALIDDATE < :B1
AND A.SUBMITDATE < :B1
AND A.SUBMITDATE > SYSDATE - 40
AND A.FEETYPE IN ('307')
AND A.PLANSTATUS = 'N'
AND ROWNUM = 1;

结合条件和上述查询结果，分析如下：

FEETYPE,PLANSTATUS是等值关联，VALIDDATE是开区间范围关联，SUBMITDATE是闭区间范围关联。已知此表中SUBMITDATE保留3年数据，在数据分布平均的情况下，此SQL查询的数据量约为(296815739/3/365)*40/25/2=21.7W，约占整个表的0.07%。理论上适合使用索引，不必要全表扫描。

索引情况分析

9d67232c1a664536f4398c83bca755027b550d4d

此表当前存在3个组合索引4个单列索引
其中前三个索引实则过滤性极差，索引的NDV值仅2个或者3个，除非值严重分布不均，同时又经常选取值少的部分，不然这类索引没有存在的必要
结合本例子SQL，涉及的列上均没有索引，建立FEETYPE, SUBMITDATE两列组合索引，理应提升SQL性能

解决方案

建立FEETYPE, SUBMITDATE组合索引，执行SQL执行时长缩短到10S以内
表按SUBMITDATE分区，数据按月存放数据

原文发布时间为：2017-11-15

本文作者：杨江

本文来自云栖社区合作伙伴“ 数据和云”，了解相关信息可以关注“ 数据和云”微信公众号

基于裸数据的异地数据库性能诊断与优化

较详细分析一个SQL的性能，需要的内容包括执行计划信息、表的基础信息、索引基础信息、SQL写法问题等等。这些内容都存放在数据字典中。

1、创建相关的表，语句参考：

表基础信息

SQL绑定变量分析

条件列数据分布情况

索引情况分析

热门文章

最新文章

相关课程

相关电子书

相关实验场景