MySQL误操作数据恢复的简单实践(r11笔记第67天)

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介:     前几天有个同事碰到了一个MySQL数据恢复的问题,他运行了一条update语句,结果忘记了加where条件,结果等反应过来已经晚了。我简单确认了下,是否存在备份,没有,是否开启了日志,没有。

    前几天有个同事碰到了一个MySQL数据恢复的问题,他运行了一条update语句,结果忘记了加where条件,结果等反应过来已经晚了。我简单确认了下,是否存在备份,没有,是否开启了日志,没有。所以这个恢复无从谈起。

    当然后来他也花了些功夫逐条数据修复,事情过去了,数据恢复的重要性,人为操作的重要性就不言而喻了,但是有些时间工作职责还是需要下移。我觉得还是需要好好总结下数据恢复的问题。我会从以下几个方面来谈。

目录

⊙  手工恢复数据的简单示例

使用开源工具恢复数据的配置

⊙  使用开源工具恢复数据的实践

小结


首先手工恢复数据,其实有一些思路,一种就是通过全备+binlog的时间、偏移量来恢复。另外一类是通过解析binlog来恢复,前提条件是日志格式为row。我们来简单模拟解析binlog的恢复方式。

手工恢复数据的简单示例

先看一看binlog的情况,可以看到当前的binlog是序号为15的日志文件。

> show binary logs;
+------------------+------------+
| Log_name         | File_size  |
+------------------+------------+
| mysql-bin.000014 | 1073742219 |
| mysql-bin.000015 |  998953054 |
+------------------+------------+
2 rows in set (0.00 sec)为了方便模拟,我们可以切换一下日志,flush logs之后得到的日志情况如下:

> show binary logs;
+------------------+-----------+
| Log_name         | File_size |
+------------------+-----------+
| mysql-bin.000015 | 999120424 |
| mysql-bin.000016 |      6722 |
+------------------+-----------+
2 rows in set (0.00 sec)创建表test

create table test (id int not null  primary key,name varchar(20),memo varchar(50)) ENGINE=InnoDB auto_increment=100 default charset=utf8;插入几条数据

> insert into test values(1,'name1','memo1'),(2,'name2','memo2'),(3,'name3','memo3'),(4,'name4','memo4'),(5,'name5','memo5');
Query OK, 5 rows affected (0.00 sec)
Records: 5  Duplicates: 0  Warnings: 0查看一下数据的基本情况:

> select * from test;
+----+-------+-------+
| id | name  | memo  |
+----+-------+-------+
|  1 | name1 | memo1 |
|  2 | name2 | memo2 |
|  3 | name3 | memo3 |
|  4 | name4 | memo4 |
|  5 | name5 | memo5 |
+----+-------+-------+为了测试方便,先标记一个时间戳>  select current_timestamp();
+---------------------+
| current_timestamp() |
+---------------------+
| 2017-02-06 04:14:33 |
+---------------------+我们开始模拟DML的操作。

> delete from test where id in (1,3);
Query OK, 2 rows affected (0.01 sec)

> update test set memo='new' where id in(2,4);
Query OK, 2 rows affected (0.01 sec)
Rows matched: 2  Changed: 2  Warnings: 0

> insert into test values(6,'name6','memo6');
Query OK, 1 row affected (0.00 sec)做完上面三个DML操作之后,我们标记一下时间。

> select current_timestamp();
+---------------------+
| current_timestamp() |
+---------------------+
| 2017-02-06 04:15:44 |
+---------------------+下面我们来解读一下binlog,根据时间戳得到一个基本可读的日志,里面还有这些数据变更,但是语句和执行的还是有一些出入,我们直接拷贝一份binlog到/tmp目录下解析。

mysqlbinlog  --no-defaults -v --start-datetime="2017-02-06 04:14:33"   --stop-datetime="2017-02-06 04:15:44"   /tmp/mysql-bin.000016 --result-file=/tmp/result.sql生成的文件result.sql内容如下,可以看到这些操作在binlog中都有了很详细的标记,数据的情况基本都是一目了然,update的部分变化前变化后的数据都一览无余。其实DML中难度较大的就是update,而insert,delete就是一个加减法。

delete操作对应binlog日志中的SQL

### DELETE FROM `test`.`test`
### WHERE
###   @1=1
###   @2='name1'
###   @3='memo1'
### DELETE FROM `test`.`test`
### WHERE
###   @1=3
###   @2='name3'
###   @3='memo3'
# at 998969666update操作对应binlog日志中的SQL

### UPDATE `test`.`test`
### WHERE
###   @1=2
###   @2='name2'
###   @3='memo2'
### SET
###   @1=2
###   @2='name2'
###   @3='new'
### UPDATE `test`.`test`
### WHERE
###   @1=4
###   @2='name4'
###   @3='memo4'
### SET
###   @1=4
###   @2='name4'
###   @3='new'
# at 998971422

insert操作对应binlog日志中的SQL

### INSERT INTO `test`.`test`
### SET
###   @1=6
###   @2='name6'
###   @3='memo6'
# at 998973859值得一提的是-v(--verbose)选项会将行事件重构成被注释掉的伪SQL语句,如果想看到更详细的信息可以使用-vv选项,这样可以包含一些数据类型和元信息的注释内容。

比如:

-vv的结果:

### DELETE FROM `test`.`test`
### WHERE
###   @1=1 /* INT meta=0 nullable=0 is_null=0 */
###   @2='name1' /* VARSTRING(60) meta=60 nullable=1 is_null=0 */
###   @3='memo1' /* VARSTRING(150) meta=150 nullable=1 is_null=0 */回到数据恢复的问题,如果需要手工恢复就需要做几件事情,一个就是根据字段标示拼接出可运行的SQL语句,然后按照逆向的顺序执行即可。

使用开源工具恢复数据的配置

   从上面的步骤可以看到,如果手工修复其实还是可以实现的,不过手工的操作不少,这个时候能够简化你的工作就是好工具,我试用了下binglog2sql这个开源工具,也是大众点评的DBA团队推出的,总体还不错。

  这个工具是Python开发,当然有一些依赖的库和环境需要配置。如果你的服务器是联网环境,那就省事多了。

两个步骤即可完成。

git clone https://github.com/danfengcao/binlog2sql.git && cd binlog2sql   
pip install -r requirements.txt  --会安装额外需要的插件而如果不是,那么就有一些额外的工作需要你去做。比如我这个环境连pip都没有。可以先在其他服务器上下载到对应的脚本,部署即可。

# wget "https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb" --no-check-certificate件有些环境在pip部署的时候可能有下面的错误。

# python setup.py  install
Traceback (most recent call last):
  File "setup.py", line 6, in <module>
    from setuptools import setup, find_packages
ImportError: No module named setuptools看来还和一个setuptools的库有关,我们继续安装。

# wget https://bootstrap.pypa.io/ez_setup.py --no-check-certificate然后使用 python ez_setup.py install 即可编译成功setuptools

再次尝试python setup.py install即可完成pip的安装。

对于插件PyMySQL可以使用如下的方式来安装:

git clone https://github.com/PyMySQL/PyMySQL对于插件mysql replication可以使用如下的方式:

git clone https://github.com/noplay/python-mysql-replication就这样前期的工作就做好了。

  使用开源工具恢复数据的实践

完成了环境的配置,工具使用起来和mysqlbinlog还是有一些相似之处,好的地方就是多了一些辅助功能。

我们创建一个用户admin来解析。

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.*  TO 'admin'@'127.0.0.1' IDENTIFIED BY  'admin';比如我们使用如下的命令来解析binlog得到指定时间戳范围内的SQL情况,在此我们限定数据为test

python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -padmin  -dtest --start-file='mysql-bin.000016' --start-datetime='2017-02-06 04:14:33' --stop-datetime='2017-02-06 04:15:44'  > /tmp/tmp.log得到的文件内容如下:

#cat /tmp/tmp.log
DELETE FROM `test`.`test` WHERE `memo`='memo1' AND `id`=1 AND `name`='name1' LIMIT 1; #start 11127 end 11321 time 2017-02-06 04:15:23
DELETE FROM `test`.`test` WHERE `memo`='memo3' AND `id`=3 AND `name`='name3' LIMIT 1; #start 11127 end 11321 time 2017-02-06 04:15:23
UPDATE `test`.`test` SET `memo`='new', `id`=2, `name`='name2' WHERE `memo`='memo2' AND `id`=2 AND `name`='name2' LIMIT 1; #start 11400 end 11625 time 2017-02-06 04:15:29
UPDATE `test`.`test` SET `memo`='new', `id`=4, `name`='name4' WHERE `memo`='memo4' AND `id`=4 AND `name`='name4' LIMIT 1; #start 11400 end 11625 time 2017-02-06 04:15:29
INSERT INTO `test`.`test`(`memo`, `id`, `name`) VALUES ('memo6', 6, 'name6'); #start 12062 end 12239 time 2017-02-06 04:15:37其实看起来还是很省事了。

如果希望得到闪回的语句,有一个flashback的选项,其实就是在原来的基础上进行了解析和顺序调整。

python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -padmin  -dtest --flashback --start-file='mysql-bin.000016' --start-datetime='2017-02-06 04:14:33' --stop-datetime='2017-02-06 04:15:44'  > /tmp/tmp.log得到的内容如下:

#cat /tmp/tmp.log
DELETE FROM `test`.`test` WHERE `memo`='memo6' AND `id`=6 AND `name`='name6' LIMIT 1; #start 12062 end 12239 time 2017-02-06 04:15:37
UPDATE `test`.`test` SET `memo`='memo4', `id`=4, `name`='name4' WHERE `memo`='new' AND `id`=4 AND `name`='name4' LIMIT 1; #start 11400 end 11625 time 2017-02-06 04:15:29
UPDATE `test`.`test` SET `memo`='memo2', `id`=2, `name`='name2' WHERE `memo`='new' AND `id`=2 AND `name`='name2' LIMIT 1; #start 11400 end 11625 time 2017-02-06 04:15:29
INSERT INTO `test`.`test`(`memo`, `id`, `name`) VALUES ('memo3', 3, 'name3'); #start 11127 end 11321 time 2017-02-06 04:15:23
INSERT INTO `test`.`test`(`memo`, `id`, `name`) VALUES ('memo1', 1, 'name1'); #start 11127 end 11321 time 2017-02-06 04:15:23运行了如上的语句之后,再次查看数据,数据就恢复了正常。

> select *from test;
+----+-------+-------+
| id | name  | memo  |
+----+-------+-------+
|  1 | name1 | memo1 |
|  2 | name2 | memo2 |
|  3 | name3 | memo3 |
|  4 | name4 | memo4 |
|  5 | name5 | memo5 |
+----+-------+-------+
5 rows in set (0.00 sec)

小结

    对于DML的闪回其实还是有一些技巧可以参考,对于DDL的闪回相对来说就麻烦的多了。我们后续也会跟进这方面的工作。但是DML的闪回场景相对要多一些,我们尤其需要注意。



相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2月前
|
关系型数据库 MySQL 数据库
MYSQL解压版安装笔记
MYSQL解压版安装笔记
80 0
|
2月前
|
SQL 关系型数据库 MySQL
(B站动力节点老杜MySQL教程)MySQL课堂笔记-day01.txt
(B站动力节点老杜MySQL教程)MySQL课堂笔记-day01.txt
|
4月前
|
关系型数据库 MySQL
mysql join 实践
mysql join 实践
20 0
|
4月前
|
SQL 关系型数据库 MySQL
mysql百万数据实践-索引
mysql百万数据实践-索引
31 0
|
4月前
|
SQL 弹性计算 关系型数据库
服务器数据恢复-华为ECS云服务器mysql数据库数据恢复案例
云服务器数据恢复环境: 华为ECS云服务器,linux操作系统,mysql数据库(innodb引擎)。作为网站服务器使用。 云服务器故障: 在执行mysql数据库版本更新测试时,误将本应该在测试库上执行的sql脚本执行在生产库上了,生产库上的部分表被truncate,部分表内有少量数据被delete。 需要恢复被truncate的表以及被少量数据被delete的表。
服务器数据恢复-华为ECS云服务器mysql数据库数据恢复案例
|
1月前
|
SQL 关系型数据库 MySQL
Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理(一篇即可学会在日常工作中使用Sqoop)
【2月更文挑战第9天】Sqoop【付诸实践 01】Sqoop1最新版 MySQL与HDFS\Hive\HBase 核心导入导出案例分享+多个WRAN及Exception问题处理(一篇即可学会在日常工作中使用Sqoop)
89 7
|
9天前
|
存储 SQL 关系型数据库
【MySQL实战笔记】03.事务隔离:为什么你改了我还看不见?-02
【4月更文挑战第7天】数据库通过视图实现事务隔离,不同隔离级别如读未提交、读已提交、可重复读和串行化采用不同策略。以可重复读为例,MySQL使用多版本并发控制(MVCC),每个事务有其独立的视图。回滚日志在无更早视图时被删除。长事务可能导致大量存储占用,应避免。事务启动可显式用`begin`或设置`autocommit=0`,但后者可能意外开启长事务。建议使用`autocommit=1`并显式管理事务,若需减少交互,可使用`commit work and chain`。
28 5
|
11天前
|
SQL 存储 关系型数据库
【MySQL实战笔记】02.一条SQL更新语句是如何执行的-2
【4月更文挑战第5天】两阶段提交是为确保`redo log`和`binlog`逻辑一致,避免数据不一致。若先写`redo log`, crash后数据可能丢失,导致恢复后状态错误;若先写`binlog`,crash则可能导致重复事务,影响数据库一致性。一天一备相较于一周一备,能缩短“最长恢复时间”,但需权衡额外的存储成本。
16 1
|
21天前
|
SQL 关系型数据库 MySQL
【MySQL技术专题】「问题实战系列」深入探索和分析MySQL数据库的数据备份和恢复实战开发指南(数据恢复补充篇)(一)
【MySQL技术专题】「问题实战系列」深入探索和分析MySQL数据库的数据备份和恢复实战开发指南(数据恢复补充篇)
29 0
|
1月前
|
SQL 关系型数据库 MySQL
OBCP实践 - 迁移 MySQL 数据到 OceanBase 集群
OBCP实践 - 迁移MySQL数据到OceanBase集群,这是一个涉及到将现有MySQL数据库的数据和表结构迁移到OceanBase分布式数据库集群的实际操作过程。OceanBase是一款高度兼容MySQL协议的分布式数据库产品,支持在线平滑迁移,以便企业用户可以从传统的MySQL数据库平滑迁移到OceanBase,以实现更高的可用性、扩展性和性能。
33 0