MySQL 复制过滤详解

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介:

一、背景

如果有这样的一个需求:master 有3个库A,B,C ,D,由于某种原因,现在需要将其中2个库B,C单独拆分出来,单独一个实例。 如果是你,打算怎么做呢? 常见的做法就是,单独搭建一个只有B,C库的实例,然后只复制master的B,C库,过滤掉A,D库。那么复制过滤就应运而生了,replicate-*-do-DB/table 等。

二、理由

为了搭建这一套环境(只复制master的B,C库),部分人会在my.cnf中这样配置:

 --replicate-do-db=B,C
AI 代码解读

当然,按照大家的惯性思维,认为这样是没有错的。不幸的是,灾难已经来临。

官方文档:

Warning
To specify multiple databases you must use multiple instances of this option. Because database names can contain commas, if you supply a comma separated list then the list will be treated as the name of a single database.
AI 代码解读

mysql 会认为B,C 为一个库名,而不是2个库。

然而,这里不仅仅有一个复制过滤参数,一共包括:

--replicate-do-db
--replicate-ignore-db
--replicate-do-table
--replicate-wild-do-table
--replicate-ignore-table
--replicate-wild-ignore-table
AI 代码解读

这里面可以随意组合,且不同组合有不同的含义,为了彻底搞清楚他们直接的关系,下面我们一起来一窥究竟。

三、Database-Level Replication 流程图

注意1:库级别的规则,只针对binlog_format='STATEMENT or MIXED‘
注意2:如果是binlog_format=‘ROW’,不受库级别规则限制,只受表级别规则限制。


rpl_db_level

四、Table-Level Replication 流程图


rpl_tb_level

五、相关要点

注意: 以下测试和结论,前提都是row_format='MIXED'


  • 在DB level 中,当binlog-format=statement 时,过滤以use DB为主(不允许跨库)。为rows模式是:不以use DB为主(允许跨库)
  • 不管binlog格式是statement,还是rows模式,table level的判断都是 不以use DB为主(可以跨库的)
  • 总的流程走向:先判断DB-level,如果DB-level 判断完成后需要exit,则退出。如果DB-level判断完成后,没有exit,则再判断Table-level
  • 在DB-level中,如果有replicate-do-db,则判断replicate-do-db,将不会走到replicate-ignore-db这层。 如果判断replicate-do-db符合条件,则判断table-level。 如果不符合,则exit
  • 在DB-level中,如果没有replicate-do-db,但是有replicate-ignore-db。 流程则是:符合replicate-ignore-db规则,则exit,不符合,则走到table-level层继续判断
  • 在Table-level中,判断逻辑顺序自上而下为:replicate-do-table -> replicate-ignore-table -> replicate-wild-do-table -> replicate-wild-ignore-table
  • 在Table-level中, 从第一个阶段(replicate-do-table)开始,如果符合replicate-do-table判断规则,则exit。如果不符合,则跳到下一层(replicate-ignore-table)。 然后以此内推,直到最后一层(replicate-wild-ignore-table)都不符合,则最后判断是否有(replicate-do-table or replicate-wild-do-table),如果有,则ignore & exit。如果没有,则execute & exit

六、测试

注意: 以下测试和结论,前提都是row_format='MIXED'


6.1 特殊情况

说明:以下测试,均以statement格式为例。 rows模式参见原理同样可以证明,这里就不解释。

  • 第一种情况:设置replicate_do_DB=A,B

结论:A和B都没有在slave上执行。因为mysql将'A,B'作为一个库名。
AI 代码解读

6.2 只有库级别的规则

注意:

  • do-db
replicate_do_DB=A
replicate_do_DB=B
AI 代码解读
  • ignoare-db
replicate_ignore_DB=A
replicate_ignore_DB=B
AI 代码解读
  • do-db & ignore-db

replicate_do_DB=A
replicate_do_DB=B
replicate-ignore-db=mysql
replicate-ignore-db=test
AI 代码解读

6.3 只有表级别的规则

  • do-table
  • ignore-table
  • wild-do-table
  • wild-ignore-table
  • do-table & ignore-table
  • do-table & wild-ignore-table
  • wild-do-table & wild-ignore-table

6.4 库和表级别的规则混用

  • do-DB & do-table
replicate_do_DB=A
replicate_do_DB=B
replicate-do-table=table1
replicate-do-table=table2
AI 代码解读
  • do-DB & wild-do-table
replicate_do_DB=A
replicate_do_DB=B
replicate-wild-do-table=mysql.%
replicate-wild-do-table=test.%
AI 代码解读
  • do-DB & ignore-table
replicate_do_DB=A
replicate_do_DB=B
replicate-ignore-table=table1
replicate-ignore-table=table2
AI 代码解读
  • do-DB & wild-ignore-table
replicate_do_DB=A
replicate_do_DB=B
replicate-wild-ignore-table=mysql.%
replicate-wild-ignore-table=test.%
AI 代码解读
  • 最常见场景: db-db & do-ignore-db & wild-do-table & wild-ignore-table
* 常见场景:将master上的A,B库 拆分到 新的一组机器上。
* 特点:
    1) slave 不复制 master的 mysql,test库
    2) slave 只复制 master的 A,B库所有操作

replicate-ignore-db=mysql
replicate-ignore-db=test
replicate-wild-ignore-table=mysql.%
replicate-wild-ignore-table=test.%

replicate_do_DB=A
replicate_do_DB=B
replicate-wild-do-table=A.%
replicate-wild-do-table=B.%


* 误区:
    1) 如果我的default database 不是A或者B,那么接下来的操作就不会被slave 执行,然后悲剧就产生了。
    master> use C;insert into A.id values(1);

    2)所以,以上cnf配置,只适合default database 是 A,B的情况。


* 如果要完成这种需求,应该这样配置【前提:开发没有权限登陆到mysql,test库】:


replicate-ignore-db=mysql
replicate-ignore-db=test
replicate-wild-ignore-table=mysql.%
replicate-wild-ignore-table=test.%

replicate-wild-do-table=A.%
replicate-wild-do-table=B.%


AI 代码解读
  • 实战: wild-do-table & ignore-table & wild-ignore-table
需求: 将老服务器上的某个库,迁移到新机器上

old_master[库: A , B , mysql] ---->(同步) new_maser[A]

        * 验证单库(A)复制的正确性: 规则=> slave 只复制A库,不复制B库
            my.cnf
                Replicate_Wild_Do_Table: A.%
                Replicate_Ignore_DB: mysql
                   Replicate_Wild_Ignore_Table: mysql.%

        a)use A/B; insert A.a select B.b from B ;  --err:同步报错,slave没有B库的内容
        b) use A/B; insert A.a select B.b from A,B where A.b=B.b;   --err:同步报错,slave没有B库的内容
        c) use mysql; insert into A.a values('a'); --err: 同步不报错,但是老master的binlog没有在slave执行,因为Replicate_Ignore_DB: mysql,Replicate_Wild_Ignore_Table: mysql.%

        d) use 空库; insert into A.a values('a');  --ok: 可以同步复制下来
        e) use B;   insert into A.a values('a');  --ok: 可以同步复制下来
AI 代码解读

由于组合太多,就不一一列举。

最后


以上情况,还可以衍生出各种场景和组合,只要弄懂了原理,基本都没有问题。

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
兰春
+关注
目录
打赏
0
0
0
1
302
分享
相关文章
面试官:说一下MySQL主从复制的原理?
面试官:说一下MySQL主从复制的原理?
214 0
面试官:说一下MySQL主从复制的原理?
MySQL主从复制之原理&一主一从部署流程—2023.04
MySQL主从复制之原理&一主一从部署流程—2023.04
1103 0
MySQL中主从复制的原理和配置命令
要原因包括提高性能、实现高可用性、数据备份和灾难恢复。了解两大线程( I/O 和 SQL)I/O线程:目的:I/O线程主要负责与MySQL服务器之外的其他MySQL服务器进行通信,以便复制(replication)数据。 功能: 当一个MySQL服务器作为主服务器(master)时,I/O线程会将变更日志(binary log)中的事件传输给从服务器(slave)。从服务器上的I/O线程负责接收主服务器的二进制日志,并将这些事件写入本地的中继日志(relay log)。 配置: 在MySQL配置文件中,你可以通过配置参数如和来启用二进制日志和指定服务器ID。log-bin server
174 1
MySQL中主从复制的原理和配置命令
RDS用多了,你还知道MySQL主从复制底层原理和实现方案吗?
随着数据量增长和业务扩展,单个数据库难以满足需求,需调整为集群模式以实现负载均衡和读写分离。MySQL主从复制是常见的高可用架构,通过binlog日志同步数据,确保主从数据一致性。本文详细介绍MySQL主从复制原理及配置步骤,包括一主二从集群的搭建过程,帮助读者实现稳定可靠的数据库高可用架构。
144 9
RDS用多了,你还知道MySQL主从复制底层原理和实现方案吗?
MySQL主从复制 —— 作用、原理、数据一致性,异步复制、半同步复制、组复制
MySQL主从复制 作用、原理—主库线程、I/O线程、SQL线程;主从同步要求,主从延迟原因及解决方案;数据一致性,异步复制、半同步复制、组复制
282 11
MySQL主从复制原理和使用
本文介绍了MySQL主从复制的基本概念、原理及其实现方法,详细讲解了一主两从的架构设计,以及三种常见的复制模式(全同步、异步、半同步)的特点与适用场景。此外,文章还提供了Spring Boot环境下配置主从复制的具体代码示例,包括数据源配置、上下文切换、路由实现及切面编程等内容,帮助读者理解如何在实际项目中实现数据库的读写分离。
417 1
MySQL主从复制原理和使用
Mysql中搭建主从复制原理和配置
主从复制在数据库管理中广泛应用,主要优点包括提高性能、实现高可用性、数据备份及灾难恢复。通过读写分离、从服务器接管、实时备份和地理分布等机制,有效增强系统的稳定性和数据安全性。主从复制涉及I/O线程和SQL线程,前者负责日志传输,后者负责日志应用,确保数据同步。配置过程中需开启二进制日志、设置唯一服务器ID,并创建复制用户,通过CHANGE MASTER TO命令配置从服务器连接主服务器,实现数据同步。实验部分展示了如何在两台CentOS 7服务器上配置MySQL 5.7主从复制,包括关闭防火墙、配置静态IP、设置域名解析、配置主从服务器、启动复制及验证同步效果。
282 0
Mysql中搭建主从复制原理和配置
说一下MySQL主从复制的原理?
【8月更文挑战第24天】说一下MySQL主从复制的原理?
91 0
(二十四)全解MySQL之主从篇:死磕主从复制中数据同步原理与优化
兜兜转转,经过《全解MySQL专栏》前面二十多篇的内容讲解后,基本对MySQL单机模式下的各方面进阶知识做了详细阐述,同时在前面的《分库分表概念篇》、《分库分表隐患篇》两章中也首次提到了数据库的一些高可用方案,但前两章大多属于方法论,并未涵盖真正的实操过程。接下来的内容,会以目前这章作为分割点,开启MySQL高可用方案的落地实践分享的新章程!
3021 1
【mysql】MySql主从复制,从原理到实践!
【mysql】MySql主从复制,从原理到实践!
335 0
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等