Mysql大数据中表分区的应用

2018-11-26 2568

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

RDS MySQL Serverless 基础系列，0.5-2RCU 50GB

云数据库 RDS MySQL，集群系列 2核4GB

云数据库 RDS MySQL，高可用系列 2核4GB

简介： Mysql大数据中表分区的应用一、支持Mysql表分区需要MYSQL版本为5.1以上，含5.1~ 二、表分区的作用：增加MYSQL的执行效率，可以在以下几点分析表分区是如何增加MYSQL的执行效率的。

Mysql大数据中表分区的应用

一、支持Mysql表分区需要MYSQL版本为5.1以上，含5.1~

二、表分区的作用：增加MYSQL的执行效率，可以在以下几点分析表分区是如何增加MYSQL的执行效率的。

1、与单个磁盘或文件系统分区相比，可以存储更多的数据。

2、对于那些已经失去保存意义的数据，通常可以通过删除与那些数据有关的分区，很容易地删除那些数据。

3、一些查询可以得到极大的优化，这主要是借助于满足一个给定WHERE语句的数据可以只保存在一个或多个分区内，这样在查找时就不用查找其他剩余的分区。

4、涉及到例如SUM()和COUNT()这样聚合函数的查询，可以很容易地进行并行处理。这种查询的一个简单例子如 “SELECT salesperson_id, COUNT (orders) as order_total FROM sales GROUP BY salesperson_id；”。通过“并行”，这意味着该查询可以在每个分区上同时进行，最终结果只需通过总计所有分区得到的结果。

5、通过跨多个磁盘来分散数据查询，来获得更大的查询吞吐量。

三、通俗的讲表分区是将一个大表，根据条件分割成若干个小表

四、表分区有哪些类型：

RANGE分区：基于属于一个给定连续区间的列值，把多行分配给分区。

LIST分区：类似于按RANGE分区，区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。

HASH分区：基于用户定义的表达式的返回值来进行选择的分区，该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL 中有效的、产生非负整数值的任何表达式。

KEY分区：类似于按HASH分区，区别在于KEY分区只支持计算一列或多列，且MySQL 服务器提供其自身的哈希函数。必须有一列或多列包含整数值。

五、细分类型

RANGE分区

<1>创建含分区表

CREATE TABLE part_tab( c1 int default NULL,

c2 varchar(30) default NULL,

c3 date default NULL) engine=myisam

PARTITION BY RANGE (year(c3))

(PARTITION p0 VALUES LESS THAN (1995),

PARTITION p1 VALUES LESS THAN (1996) ,

PARTITION p2 VALUES LESS THAN (1997) ,

PARTITION p3 VALUES LESS THAN (1998) ,

PARTITION p4 VALUES LESS THAN (1999) ,

PARTITION p5 VALUES LESS THAN (2000) ,

PARTITION p6 VALUES LESS THAN (2001) ,

PARTITION p7 VALUES LESS THAN (2002) ,

PARTITION p8 VALUES LESS THAN (2003) ,

PARTITION p9 VALUES LESS THAN (2004) ,

PARTITION p10 VALUES LESS THAN (2010),

PARTITION p11 VALUES LESS THAN MAXVALUE);

<1>创建不含分区表

CREATE TABLE no_part_tab( c1 int default NULL,

c2 varchar(30) default NULL,

c3 date default NULL) engine=myisam

<3>创建存储过程，在表中插入800,0000条数据以做测试

CREATE PROCEDURE load_part_tab()

begin

declare v int default 0;

while v < 8000000

insert into part_tab

values (v,'testing partitions',adddate('1995-01-01',(rand(v)*36520) mod 3652));

set v = v + 1;

end while;

end

<4>再写入未分区表中

insert into no_part_tab select * from part_tab;

<5>好了，所有表数据准备完毕，下面我们来做一下测试

执行命令： select count(*) from no_part_tab where c3 >date('1995-01-01') and c3 < date('1995-12-31');

执行结果：[SQL] select count(*) from no_part_tab where c3 >date('1995-01-01') and c3 <date('1995-12-31'); 受影响的行: 0 时间: 2.594ms 执行命令： select count(*) from part_tab where c3 >date('1995-01-01') and c3 < date('1995-12-31'); 执行结果：[SQL] select count(*) from part_tab where c3 > date('1995-01-01') and c3 <date('1995-12-31');

受影响的行: 0

时间: 0.297ms

很清楚的看到了，读取同样的数据，分区与未分区的两个表相差的不是同一个级别的数据~，接下来就可以修改自己大数据的表了

ALTER TABLE sale_data REORGANIZE PARTITION p2010Q1 INTO (

PARTITION s2009 VALUES LESS THAN (201001),

PARTITION s2010 VALUES LESS THAN (201004)

);

---------------------

作者：大事龙

来源：CSDN

原文： https://blog.csdn.net/w_yunlong/article/details/50432448

Mysql大数据中表分区的应用

Mysql大数据中表分区的应用

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Mysql大数据中表分区的应用

Mysql大数据中表分区的应用

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像