Mysql事务隔离级别及MVCC-阿里云开发者社区

mysql比较重要的事务特性与隔离级别，怎么能够错过对它们的认识和介绍。
1. 事务
事务就是一组原子操作，要么全部执行更新成功，要么全部失败。
ACID(原子性、一致性、隔离性和持久性)

原子性：一个事务必须视作一个不可分割的最小工作单元。
一致性：数据库从一致性的状态转换到另外一个一致性状态，如：用户在执行update 减钱或update 加钱的时候，系统崩溃，数据库里面的数据是没有被修改的。因为事务未被提交。
隔离性：一个事务所做的修改在最终提交之前，对其他事务是不可见的。在update 减100元执行完但未提交，另一个事务看到的余额是未被减少的数据结果。
持久性：一旦数据提交，所做的修改会永远存在数据库中。

实际中，要完全实现ACID，会非常困难，需要做额外很多工作来达到这个效果，而这些额外的工作对用户是不可感知的。

为了更好地理解ACID，以银行账户转账为例：

1 START TRANSACTION;
2 SELECT balance FROM checking WHERE customer_id = 702332;
3 UPDATE checking SET balance = balance - 100.00 WHERE customer_id = 702332;
4 UPDATE savings SET balance = balance + 100.00 WHERE customer_id = 702332;
5 COMMIT;

原子性：要么完全提交（702332的checking余额减少100，savings 的余额增加100），要么完全回滚（两个表的余额都不发生变化）
一致性：这个例子的一致性体现在 100元不会因为数据库系统运行到第3行之后，第4行之前时崩溃而不翼而飞，因为事物还没有提交。
隔离性：允许在一个事务中的操作语句会与其他事务的语句隔离开，比如事务A运行到第3行之后，第4行之前，此时事务B去查询checking余额时，它仍然能够看到在事务A中被减去的100元，因为事务A和B是彼此隔离的。在事务A提交之前，事务B观察不到数据的改变。
持久性：这个很好理解。
事务跟锁一样都会需要大量工作，因此你可以根据你自己的需要来决定是否需要事务支持，从而选择不同的存储引擎。

2. 隔离级别
在SQL 标准中定义了四种隔离级别。
较低的隔离级别通常可以执行更高的并发，系统的开销也是更低的。

READ UNCOMMITED 未提交读
事务中修改了数据，即便是未提交，也被其他事务可见，这样就造成了脏读。脏读会带来很多问题，自己也可以想象之，所以很少使用它。

READ COMMITED 提交读
这是大多数数据库的默认隔离级别，一个事务修改数据但未提交，对其他任何事务都是不可见的。也就是不可重复读

REPATABLE READ 可重复读
解决了脏读的问题，但是不能解决另外一个问题，幻读。所谓幻读，就是当某个事务读取某个范围内的记录时，另外一个事务又在该范围插入了新纪录，当之前的事务再次来读取该范围的数据时，发现还有新数据未被更新，就像产生了幻觉一样，即产生幻行。InnoDB 采取了（MVCC, Multiversion Concurrency Control）解决了幻读的问题。
可重复读是 Mysql 的默认事务隔离级别。

SERIALIZABLE 可串行化
它是最高的隔离界别。它通过强制事务串行化，避免了前面所说的幻读问题。简单的说，就是 SERIALIZABLE 会在读取的每一行数据上都加锁，这样会导致大量的超时和锁竞争的问题。实际上也是很少用它来。

查看隔离级别：SELECT @@tx_isolation
设置mysql的隔离级别：set session transaction isolation level 设置事务隔离级别

2.2 死锁
死锁就不再解释，之前有一篇文章单独介绍了死锁及死锁检测，mysql 解决死锁的方式为，死锁检测和死锁超时机制。
InnoDB 实现的方法是，将持有最少的行级排它锁的事务进行回滚。

死锁可能是正在的数据导致，还有可能是存储引擎的实现方式所致。
一般只需要重新执行因死锁而回滚的事务即可。

2.3 事务日志
修改数据，是修改内存拷贝，再把该修改行为记录到持久化事务日志中，而不是每次将修改的数据本身持久到磁盘中。

2.4 mysql 中的事务
Mysql 提供了两种事务型的存储引擎：InnoDB 和 NDB Cluster。也支持第三方引擎

自动提交 AUTOCOMMIT
Mysql 默认采用自动提交模式，如每个select 语句都被当作一个事务执行提交操作。

对MyISAM 自动提交对此类非事务型引擎不起作用。

3. 多版本并发控制
先来谈谈redo log 和 undo log
1.redo log通常是物理日志，记录的是数据页的物理修改，它用来恢复提交后的物理数据页(有且只能恢复到最后一次提交的位置)。
2.undo用来回滚行记录到某个版本。undo log一般是逻辑日志，记录每行数据。

MVCC (Multiversion Concurrency Control)，即多版本并发控制技术,它使得大部分支持行锁的事务引擎，不再单纯的使用行锁来进行数据库的并发控制，取而代之的是把数据库的行锁与行的多个版本结合起来，只需要很小的开销,就可以实现非锁定读，从而大大提高数据库系统的并发性能

InnoDB是一个多版本存储引擎：它保存有关已更改行的旧版本的信息，以支持并发和回滚等事务功能。此信息存储在表空间中称rollback segment的数据结构中。 InnoDB使用rollback segment中的信息来执行事务回滚中所需的撤消操作。它还使用该信息构建行的早期版本以进行一致读取。

在内部，InnoDB为存储在数据库中的每一行添加三个字段。
●6字节的DB_TRX_ID字段指示插入或更新该行的最后一个事务的事务标识符。此外，删除在内部被视为更新，其中行中的special bit被设置为将其标记为已删除。
●每行还包含一个7字节的DB_ROLL_PTR字段，称为滚动指针。 roll指针指向写入回滚段的undo log记录。如果更新了行，则undo log记录了能重建更新之前数据的所有必要信息。
●6字节的DB_ROW_ID字段包含在插入新行时单调增加的行ID。如果InnoDB自动生成聚簇索引，则索引包含行ID值。否则，DB_ROW_ID列不会出现在任何索引中。

rollback段中的undo logs分为插入和更新undo log。只在事务回滚中才需要插入undo log，并且可以在事务提交后立即丢弃。更新undo log也用于一致性读取，但只有在InnoDB没有分配快照的事务之后才能丢弃它们，在一致读取中可能需要更新undo log中的信息来构建早期版本的数据库行。

在InnoDB多版本控制方案中，当您使用SQL语句删除行时，不会立即从数据库中物理删除该行。 InnoDB在丢弃为删除写入的更新撤消日志记录时，仅物理删除相应的行及其索引记录。此删除操作称为清除，并且速度非常快，通常与执行删除的SQL语句的时间顺序相同。

如果你在表中以大约相同的速率插入和删除少量批次的行，则清除线程可能开始落后，并且由于所有“死”行，表可以变得越来越大，使得所有磁盘都受到限制慢。在这种情况下，通过调整innodb_max_purge_lag系统变量来限制新行操作，并为清除线程分配更多资源。有关更多信息。

多版本控制和二级索引
InnoDB多版本并发控制（MVCC）以不同于聚簇索引的方式处理二级索引。聚集索引中的记录就地更新，其隐藏的系统列指向可以重建早期版本记录的撤消日志条目。与聚簇索引记录不同，二级索引记录不包含隐藏的系统列，也不会就地更新。

更新二级索引列时，旧的二级索引记录将被删除标记，插入新记录，最终清除delete-marked的记录。当二级索引记录被delete-marked或二级索引页面由较新的事务更新时，InnoDB在聚簇索引中查找数据库记录。在聚簇索引中，将检查记录的DB_TRX_ID，如果在启动读取事务后修改了记录，则会从undo log中检索正确的记录版本。

如果二级索引记录被标记为删除或二级索引页面由较新的事务更新，则不使用覆盖索引技术。 InnoDB不是从索引结构返回值，而是在聚簇索引中查找记录。

进行一些实例操作，执行reset master 命令清理所有binlog
新建user表

CREATE TABLE `user` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键id',
  `name` varchar(20) DEFAULT NULL COMMENT '姓名',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

插入几条数据

INSERT INTO `user` (`name`) VALUES ('zhangsan');
INSERT INTO `user` (`name`) VALUES ('lisi');
INSERT INTO `user` (`name`) VALUES ('wangwu');

对于insert:
begin->用排他锁锁定该行->记录redo log->记录undo log->插入当前行的新值，写事务编号。若回滚，回滚时把insert undo log丢弃
对于update：
begin->用排他锁锁定该行->记录redo log->记录undo log->修改当前行的值，写事务编号。若回滚，回滚指针指向undo log中的修改前的行

SELECT
Innodb检查每行数据，确保他们符合两个标准：
1、InnoDB只查找版本早于当前事务版本的数据行(也就是数据行的版本必须小于等于事务的版本)，这确保当前事务读取的行都是事务之前已经存在的，或者是由当前事务创建或修改的行
2、行的删除操作的版本一定是未定义的或者大于当前事务的版本号，确定了当前事务开始之前，行没有被删除
符合了以上两点则返回查询结果。

INSERT
InnoDB为每个新增行记录当前系统版本号（事务id）。
DELETE
InnoDB为删除的每一行，保存当前系统版本号作为删除标识。
UPDATE
InnoDB为插入一行新记录，保存当前系统版本号作为行版本号，同时保存当前系统版本到原来的行作为行删除标识（special bit）。

执行

update user set name='zhangsan22' where id=1;

Binlog的记录

执行

delete from user where id=1;

Binlog的记录

对应行插入、更新、删除的过程如下图所示

从官方文档可知，删除时先标记为delete-marked，之后再通过purge的方式进行删除。
事务提交的时候，也会将该事务对应的undo log放入到删除列表中，未来通过purge来删除。
update分为两种情况：update的列是否是主键列
①如果不是主键列，在undo log中直接反向记录是如何update的。即update是直接进行的。
②如果是主键列，update分两步执行：先删除该行，再插入一行目标行。记住，sql每一事务操作都会产生新的版本（事务id）。

Mysql事务隔离级别及MVCC

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像