数据库范式及MYSQL优化整体思路-阿里云开发者社区

数据库范式及MYSQL优化整体思路

2017-07-03 1301

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云数据库 RDS MySQL Serverless，0.5-2RCU 50GB

简介：

一、数据库范式

　　为了建立冗余较小、结构合理的数据库，设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库，必须满足一定的范式。

　　 1.1、第一范式（1NF：每一列不可包含多个值）

　　所谓第一范式（1NF）是指数据库表的每一列都是不可分割的基本数据项，同一列中不能有多个值，即实体中的某个属性不能有多个值或者不能有重复的属性。如果出现重复的属性，就可能需要定义一个新的实体，新的实体由重复的属性构成，新实体与原实体之间为一对多关系。在第一范式（1NF）中表的每一行只包含一个实例的信息。

　　在任何一个关系数据库中，第一范式（1NF）是对关系模式的基本要求，不满足第一范式（1NF）的数据库就不是关系数据库。

　　1.2、第二范式（2NF：非主属性部分依赖于主关键字）

　　第二范式（2NF）是在第一范式（1NF）的基础上建立起来的，即满足第二范式（2NF）必须先满足第一范式（1NF）。第二范式（2NF）要求数据库表中的每个实例或行必须可以被唯一地区分。为实现区分通常需要为表加上一个列，以存储各个实例的唯一标识。

　　第二范式（2NF）要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性，如果存在，那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体，新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列，以存储各个实例的唯一标识。简而言之，第二范式就是非主属性部分依赖于主关键字。

　　1.3、第三范式（3NF：属性不依赖于其它非主属性）

　　满足第三范式（3NF）必须先满足第二范式（2NF）。简而言之，第三范式（3NF）要求一个数据库表中不包含已在其它表中已包含的非主关键字信息。例如，存在一个部门信息表，其中每个部门有部门编号、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表，则根据第三范式（3NF）也应该构建它，否则就会有大量的数据冗余。简而言之，第三范式就是属性不依赖于其它非主属性。

　　 1.4、反三范式（反3NF：为了性能，增加冗余）

　　3NF提出目的是为了降低冗余，减少不必要的存储，这对于存储设备昂贵的过去是很有必要的，但是随着存储设备的降价以及人们对性能的不断提高，又有人提出反三范式。

　　所谓反三范式就是为了性能，增加冗余。以部门信息表为例，每个部门有部门编号、部门名称、部门简介等信息，按照3NF的要求，为了避免冗余，我们在员工表中就不应该加入部门名称、部门简介等部门有关信息，带来的代价是每次都要查询两次数据库。反三范式允许我们冗余重要信息到员工表中，例如部门名称，这样我们每次取员工信息时就能直接取出部门名称，不需要查询两次数据库，提升了程序性能。

　　二、MYSQL优化整体思路

　　MYSQL优化首先应该定位问题，可能导致MYSQL低性能的原因有：业务逻辑过多的查询、表结构不合理、 sql语句优化以及硬件优化，从优化效果来看，这四个优化点的优化效果依次降低：理清业务逻辑能够帮助我们避免不必要的查询，合理设计表结构也能帮助我们少查询数据库。对于sql语句优化，我们可以先使用慢查询日志定位慢查询，然后针对该查询进行优化，最常见且最有效的优化范式就是增加合理的索引，这个在上篇博客已经讲解，本篇博客将讲解其他一些优化手段或者注意点。

　　2.1、谨慎使用TEXT/BLOB类型

　　当列类型是TEXT或者BLOB时，我们应该特别注意，因为当选择的字段有 text/blob 类型的时候，无法创建内存表，只能创建硬盘临时表，而硬盘临时表的性能比内存表的性能差，所以如果非要使用TEXT/BLOB类型，应该单独建表，不要把TEXT/BLOB类型与核心属性混合在一张表中。对此，做一个实验如下：

//创建数据表

create table t1 (

num int,

intro text(1000)

);

//插入数据

insert into t1 values (3,'this is USA') , (4,'China');

//查询临时表创建情况

//注意，这里Created_tmp_disk_tables=4，Created_tmp_tables=10

mysql> show status like '%tmp%';

+-------------------------+-------+

| Variable_name | Value |

+-------------------------+-------+

| Created_tmp_disk_tables | 4 |

| Created_tmp_files | 9 |

| Created_tmp_tables | 10 |

+-------------------------+-------+

//使用group by查询数据

mysql> select * from t1 group by num;

+------+-------------+

| num | intro |

+------+-------------+

| 3 | this is USA |

| 4 | China |

+------+-------------+

2 rows in set (0.05 sec)

//再次查询临时表创建情况

//现在，Created_tmp_disk_tables=5，Created_tmp_tables=11

mysql> show status like '%tmp%';

+-------------------------+-------+

| Variable_name | Value |

+-------------------------+-------+

| Created_tmp_disk_tables | 5 |

| Created_tmp_files | 9 |

| Created_tmp_tables | 11 |

+-------------------------+-------+

最新内容请见作者的GitHub页：http://qaseven.github.io/

数据库范式及MYSQL优化整体思路

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像