MySQL分库分表使用Snowflake全局ID生成器(3rd)

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:

前言

由于考虑到以后要动态切分数据,防止将不同表切分数据到同一个表中时出现主键相等的冲突情况,这里我们使用一个全局ID生存器。重要的是他是自增的。

这边我使用Snowflake的python实现版(pysnowflake)。当然你也可以使用java实现版.

具体详细信息:http://pysnowflake.readthedocs.org/en/latest/

Snowflake的使用

安装 requests

pip install requests

安装 pysnowflake

pip install pysnowflake

启动pysnowflake服务

snowflake_start_server \

  --address=192.168.137.11 \

  --port=30001 \

  --dc=1 \

  --worker=1 \

  --log_file_prefix=/tmp/pysnowflask.log

--address本机的IP地址默认localhost这里解释一下参数意思(可以通过--help来获取):

--dc数据中心唯一标识符默认为0

--worker工作者唯一标识符默认为0

--log_file_prefix日志文件所在位置

使用示例(这边引用官网的)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
>>>  import  snowflake.client
  
# 链接服务端并初始化一个pysnowflake客户端
>>> host  =  '192.168.137.11'
>>> port  =  30001
>>> snowflake.client.setup(host, port)
# 生成一个全局唯一的ID(在MySQL中可以用BIGINT UNSIGNED对应)
>>> snowflake.client.get_guid()
3631957913783762945
# 查看当前状态
>>> snowflake.client.get_stats()
{
   'dc' 1 ,
   'worker' 1 ,
   'timestamp' 1454126885629 # current timestamp for this worker
   'last_timestamp' 1454126890928 # the last timestamp that generated ID on
   'sequence' 1 # the sequence number for last timestamp
   'sequence_overload' 1 # the number of times that the sequence is overflow
   'errors' 1 # the number of times that clock went backward
}

数据整理重建ID

重建ID是一个很庞大的工程,首先要很了解表的结构。不然,如果少更新了某个表的一列都会导致数据的不一致。

当然,如果你的表中有很强的外键以及设置了级联那更新一个主键会更新其他相关联的外键。这里我还是不建议去依赖外键级联更新来投机取巧毕竟如果有数据库的设计在项目的里程碑中经过了n次变化,也不能肯定设置的外键一定是级联更新的。

在这边我强烈建议重建ID时候讲MySQL中的检查外键的参数设置为0。

1
SET  FOREIGN_KEY_CHECKS=0;


小提示:其实理论上我们是没有必要重建ID的因为原来的ID已经是唯一的了而且是整型,他兼容BIGINT。但是这里我还是做了重建,主要是因为以后的数据一致。并且如果有些人的ID不是整型的,而是有一定含义的那时候也肯定需要做ID的重建。

修改相关表ID的数据类型为BIGINT

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
-- 修改商品表 goods_id 字段
ALTER  TABLE  goods_1
   MODIFY  COLUMN  goods_id  BIGINT  UNSIGNED  NOT  NULL 
   COMMENT  '商品ID' ;
  
-- 修改出售订单表 goods_id 字段
ALTER  TABLE  sell_order_1
   MODIFY  COLUMN  sell_order_id  BIGINT  UNSIGNED  NOT  NULL 
   COMMENT  '出售订单ID' ;
  
-- 修改购买订单表 buy_order_id 字段
ALTER  TABLE  buy_order_1
   MODIFY  COLUMN  buy_order_id  BIGINT  UNSIGNED  NOT  NULL 
   COMMENT  '出售订单ID与出售订单相等' ;
  
-- 修改订单商品表 order_goods_id、orders_id、goods_id 字段
ALTER  TABLE  order_goods_1
   MODIFY  COLUMN  order_goods_id  BIGINT  UNSIGNED  NOT  NULL 
   COMMENT  '订单商品表ID' ;
ALTER  TABLE  order_goods_1
   MODIFY  COLUMN  sell_order_id  BIGINT  UNSIGNED  NOT  NULL 
   COMMENT  '订单ID' ;
ALTER  TABLE  order_goods_1
   MODIFY  COLUMN  goods_id  BIGINT  UNSIGNED  NOT  NULL 
   COMMENT  '商品ID' ;


使用python重建ID

使用的python 模块:

wKiom1bT7Sezkr04AAAhqjif084111.png

这边只展示主程序:完整的程序在附件中都有

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
if  __name__ = = '__main__' :
   # 设置默认的数据库链接参数
   db_config  =  {
     'user'     'root' ,
     'password' 'root' ,
     'host'     '127.0.0.1' ,
     'port'     3306 ,
     'database' 'test'
   }
   # 设置snowflake链接默认参数
   snowflake_config  =  {
     'host' '192.168.137.11' ,
     'port' 30001
   }
  
   rebuild  =  Rebuild()
   # 设置数据库配置
   rebuild.set_db_config(db_config)
   # 设置snowflak配置
   rebuild.set_snowflake_config(snowflake_config)
   # 链接配置snowflak
   rebuild.setup_snowflake()
  
   # 生成数据库链接和
   rebuild.get_conn_cursor()
  
   ##########################################################################
   ## 修改商品ID
   ##########################################################################
   # 获得商品的游标
   goods_sql  =  '''
     SELECT goods_id FROM goods
   '''
   goods_iter  =  rebuild.execute_select_sql([goods_sql])
   # 根据获得的商品ID更新商品表(goods)和订单商品表(order_goods)的商品ID 
   for  goods  in  goods_iter:
     for  (goods_id, )  in  goods:
       rebuild.update_table_id( 'goods' 'goods_id' , goods_id)
       rebuild.update_table_id( 'order_goods' 'goods_id' , goods_id, rebuild.get_current_guid())
     rebuild.commit()
  
   ##########################################################################
   ## 修改订单ID, 这边我们规定出售订单ID和购买订单ID相等
   ##########################################################################
   # 获得订单的游标
   orders_sql  =  '''
     SELECT sell_order_id FROM sell_order_1
   '''
   sell_order_iter  =  rebuild.execute_select_sql([orders_sql])
   # 根据出售订单修改 出售订单(sell_order_1)、购买订单(buy_order_1)、订单商品(order_goods)的出售订单ID
   for  sell_order_1  in  sell_order_iter:
     for  (sell_order_id, )  in  sell_order_1:
       rebuild.update_table_id( 'sell_order_1' 'sell_order_id' , sell_order_id)
       rebuild.update_table_id( 'buy_order_1' 'buy_order_id' , sell_order_id, rebuild.get_current_guid())
       rebuild.update_table_id( 'order_goods' 'sell_order_id' , sell_order_id, rebuild.get_current_guid())
     rebuild.commit()
  
   ##########################################################################
   ## 修改订单商品表ID
   ##########################################################################
   # 获得订单商品的游标
   order_goods_sql  =  '''
     SELECT order_goods_id FROM order_goods
   '''
   order_goods_iter  =  rebuild.execute_select_sql([order_goods_sql])
   for  order_goods  in  order_goods_iter:
     for  (order_goods_id, )  in  order_goods:
       rebuild.update_table_id( 'order_goods' 'order_goods_id' , order_goods_id)
     rebuild.commit()
   # 关闭游标
   rebuild.close_cursor( 'select' )
   rebuild.close_cursor( 'dml' )
   # 关闭连接
   rebuild.close_conn()

完整的python程序:rebuild_id.py

执行程序


python rebuild_id.py

最后查看表的结果

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
SELECT  FROM  goods LIMIT 0, 1;
+ ---------------------+------------+---------+----------+
| goods_id            | goods_name | price   | store_id |
+ ---------------------+------------+---------+----------+
| 3791337987775664129 | goods1     | 9369.00 |        1 |
+ ---------------------+------------+---------+----------+
SELECT  FROM  sell_order_1 LIMIT 0, 1;
+ ---------------------+---------------+---------+---------+--------+
| sell_order_id       | user_guide_id | user_id | price   | status |
+ ---------------------+---------------+---------+---------+--------+
| 3791337998693437441 |             1 |      10 | 5320.00 |      1 |
+ ---------------------+---------------+---------+---------+--------+
SELECT  FROM  buy_order_1 LIMIT 0, 1;
+ ---------------------+---------+---------------+
| buy_order_id        | user_id | user_guide_id |
+ ---------------------+---------+---------------+
| 3791337998693437441 |      10 |             1 |
+ ---------------------+---------+---------------+
SELECT  FROM  order_goods LIMIT 0, 1;
+ ---------------------+---------------------+---------------------+---------------+---------+------+
| order_goods_id      | sell_order_id       | goods_id            | user_guide_id | price   | num  |
+ ---------------------+---------------------+---------------------+---------------+---------+------+
| 3792076554839789569 | 3792076377064214529 | 3792076372429508609 |             1 | 9744.00 |    2 |
+ ---------------------+---------------------+---------------------+---------------+---------+------+

建议:如果在生产上有使用到snowflake请务必要弄一个高可用防止单点故障,具体策略看你们自己定啦。

出自:http://www.ttlsa.com/mysql/mysql-distributed-database-and-table-snowflake-unique-id/



      本文转自027ryan  51CTO博客,原文链接:http://blog.51cto.com/ucode/1746016,如需转载请自行联系原作者







相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
存储 关系型数据库 MySQL
如何在MySQL现有表中添加自增ID?
如何在MySQL现有表中添加自增ID?
125 5
如何在MySQL现有表中添加自增ID?
|
4月前
|
存储 SQL 关系型数据库
MySQL分库分表
MySQL分库分表
41 0
|
4月前
|
关系型数据库 MySQL Java
MySQL单表膨胀优化之MyCat分库分表
MySQL单表膨胀优化之MyCat分库分表
64 0
|
4月前
|
SQL 关系型数据库 MySQL
②⑩① 【MySQL】什么是分库分表?拆分策略有什么?什么是MyCat?
②⑩① 【MySQL】什么是分库分表?拆分策略有什么?什么是MyCat?
56 0
|
3月前
|
SQL 存储 关系型数据库
Mysql系列-5.Mysql分库分表(中)
Mysql系列-5.Mysql分库分表
35 0
|
4月前
|
中间件 关系型数据库 Java
MySQL数据库分库分表方案
MySQL数据库分库分表方案
138 0
MySQL数据库分库分表方案
|
27天前
|
SQL 关系型数据库 MySQL
Mysql数据库一个表字段中存了id,并以逗号分隔,id对应的详细信息在另一个表中
Mysql数据库一个表字段中存了id,并以逗号分隔,id对应的详细信息在另一个表中
10 0
|
27天前
|
缓存 关系型数据库 MySQL
为啥MySQL官方不推荐使用uuid或者雪花id作为主键
为啥MySQL官方不推荐使用uuid或者雪花id作为主键
22 1
|
5月前
|
SQL 关系型数据库 MySQL
MySQL的自增id会用完吗?用完怎么办?
MySQL的自增id会用完吗?用完怎么办?
102 0
|
2月前
|
存储 关系型数据库 MySQL
用雪花 ID 和 UUID 做 MySQL 主键,可以吗?
用雪花 ID 和 UUID 做 MySQL 主键,可以吗?
31 0
用雪花 ID 和 UUID 做 MySQL 主键,可以吗?