<返回更多

MySQL 中你必须要懂的 MVCC

2020-06-28    
加入收藏

前言

MySQL 是目前流行的开源数据库之一,各大公司都使用 MySQL 作为自家的关系型数据库,但是 MySQL 作为一个数据库而言,基本使用是非常简单的,只要会一点点建表语句(可以使用工具建表),一点点查询语句就可以使用 MySQL 来存储数据了。

这种没有灵魂的操作,对于很多初学者来说也许已经是家常便饭了。但是对于一些已经有开发经验的人来说,这是远远不够的。你必须要学习很多数据库相关的知识,而这一篇就是彻底来剖析 MySQL 中的 MVCC 是如何实现的。看完这篇文章,你就可以知道各种隔离级别之下,MVCC 的作用是什么?MVCC 在什么时候会使用?怎么使用?

示例表

CREATE TABLE `test`.`Untitled`  (
  `id` int(10) UNSIGNED NOT NULL AUTO_INCREMENT,
  `phone` char(11) NOT NULL,
  `name` varchar(255) NOT NULL,
  `age` int(3) NOT NULL,
  `country` varchar(255) NOT NULL,
  PRIMARY KEY (`id`) USING BTREE,
  UNIQUE INDEX `uk_phone`(`phone`) USING BTREE,
  INDEX `idx_name`(`name`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 1 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_general_ci ROW_FORMAT = Dynamic;
复制代码
insert into person values (null, '1351111111', 'any', 20, '蜀');
insert into person values (null, '1351111112', 'bat', 21, '吴');
复制代码

id phone name age country 1 1351111111 any 20 蜀 2 1351111112 bat 21 吴

MVCC

MVCC 是无锁操作的一种实现方式,无锁就是没有锁。无锁能够大幅度提高数据库的并发性。它最基本的表现形式就是一致性非锁定读,通过 MVCC (多版本并发控制)来实现。MVCC 主要又是依靠 Read View 来实现的。

在数据库中的每一条记录实际都会存在三个隐藏列:

start transaction;
update person set age = 22 where id = 1;
update person set name = 'out' where id = 1;
commit;
复制代码

当执行完上面两条语句之后,但是还没有提交事务之前,它的版本链如下图所示:

MySQL 中你必须要懂的 MVCC

 

而 Read View 是用来判断每一个读取语句有资格读取版本链中的哪个记录。所以在在读取之前,都会生成一个 Read View。然后根据生成的 Read View 再去读取记录。

在事务中,只有执行插入、更新、删除操作时才会分配到一个事务 id。如果事务只是一个单纯的读取事务,那么它的事务 id 就是默认的 0。

Read View 的结构如下:

MySQL 中你必须要懂的 MVCC

 

MySQL 会根据以下规则来判断版本链中的哪个版本(记录)是在事务中可见的:

例如:

MySQL 中你必须要懂的 MVCC

 

我们首先步骤 1 中开启了一个读取事务,因为它是一个只读事务,所以它的事务 id 为 0(以下简称事务 0)。紧接着我们在事务 0 中查询 id 为 1 的记录。此时,版本链如下:

MySQL 中你必须要懂的 MVCC

 

注意:跟红色表头连接在一起的记录都是在 B+ 树中的,而通过 roll_ptr 指针连接的记录都是存在于 undo log 中的。以下的所有版本链都是这种形式。

READ UNCOMMITTED

该隔离级别不会使用 MVCC。它只要执行 select,那么就会获取 B+ 树上最新的记录。而不管该记录的事务是否已经提交。

READ COMMITTED

在 READ COMMITTED 隔离级别下,会使用 MVCC。在开启一个读取事务之后,它会在每一个 select 操作之前都生成一个 Read View。

因为步骤 2 中的 select 读取时,没有活跃的事务,也就表明所有的事务都是已经提交了的。所以它能读取到第一条记录。

执行步骤 3, 开启一个新的事务,事务 id 为 101(以下检测事务 101)。

执行步骤 4,它修改了 id 为 1 的记录,此时版本链将会变为如下:

MySQL 中你必须要懂的 MVCC

 

执行步骤 5,事务 0 执行了一个 select 操作,事务 0 会生成一个 Read View。Read View 的值如下:

MySQL 中你必须要懂的 MVCC

 

我们根据上面对版本链中的记录可见性规则:

  1. 版本链中的第一条记录,它的 trx_id 不小于 min_trx_id,所以该记录不可见。
  2. 版本链中的第二条记录,它的 trx_id 小于 min_trx_id,所以该记录可见。

所以对于此次的查询,它能获得的记录就是:

MySQL 中你必须要懂的 MVCC

 

事务 101 在步骤 5 中执行了一个更新操作,执行步骤 6,提交该事务之后,版本链如下:

MySQL 中你必须要懂的 MVCC

 

执行步骤 7,我们在事务 0 中执行一次 select 查询,因为我们的隔离级别是 READ COMMITTED,所以此次查询也会生成一个 Read View。该 Read View 的值如下:

MySQL 中你必须要懂的 MVCC

 

然后根据版本链可见性规则:

那么这次的查询可以得到的记录如下所示:

MySQL 中你必须要懂的 MVCC

 

在事务 0 执行完查询之后,我们又开启了一个事务 id 为 102 的新事务(以下简称事务 102),该事务也对 id 为 1的记录进行了更新。

步骤 9 中的查询自行分析。我们直接给出事务 102 执行完两条更新语句的最终版本链:

MySQL 中你必须要懂的 MVCC

 

执行步骤 11,根据版本链可见性规则,它能获取到的记录:

MySQL 中你必须要懂的 MVCC

 

REPEATABLE READ

实际上,REPEATABLE READ 与 READ COMMITTED 的区别只有在生成 Read View 的时机上。

READ COMMITTED 是在每次执行 select 操作时,都会生成一个新的 Read View。而 REPEATABLE READ 只会在第一次执行 select 操作时生成一个 Read View,直到该事务提交之前,所有的 select 操作都是使用第一次生成的 Read View。

我们重新执行一下表中的步骤。

首先,执行到步骤 2,事务 0 开启了事务之后,并执行一次 select 查询。此时会生成一个 Read View。该 Read View 的结构如下:

MySQL 中你必须要懂的 MVCC

 

生成的 Read View 将会一直使用,直到事务 0 提交。

所以,尽管后面的开启了两个事务,并且对记录进行修改,使得最终的版本链变为如下所示:

MySQL 中你必须要懂的 MVCC

 

但是事务 0 依然只能读取到最开始的那条记录,也就是:

MySQL 中你必须要懂的 MVCC

 

不管事务 0 在任何时候执行 select * from person where id = 1; 读取记录,那么它都只会使用第一次生成的 Read View 在版本链中选择可以读取的记录。

SERIALIZABLE

该隔离级别不会使用 MVCC。如果使用的是普通的 select 语句,它会在该语句后面加上 lock in share mode,变为一致性锁定读。假设一个事务读取一条记录,其他事务对该记录的更改都会被阻塞。假设一个事务在更改一条记录,其他事务对该记录的读取都会被阻塞。

在该隔离级别下,读写操作变为了串行操作。

总结

通过上面的文章,我们可以知道在 READ COMMITTED 和 REPEATABLE READ 隔离等级之下才会使用 MVCC。

但是 READ COMMITTED 和 REPEATABLE READ 使用 MVCC 的方式各不相同:

而 READ UNCOMMITTED 和 SERIALIZABLE 隔离级别不会使用 MVCC。

它们的读取操作也不相同:


原文链接:https://juejin.im/post/5eeafc15e51d4573fa7d5824

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>