在使用数据库的过程中,事务通常是我们一个很熟悉的概念。
事务的主要目标是确保一组数据库操作全部成功或全部失败。
在MySQL中,事务支持是在存储引擎级别实现的。
需要注意的是,MySQL 是一个支持多种存储引擎的系统,但并非所有引擎都提供事务支持。例如,MySQL原生的MyISAM存储引擎不支持事务,这也是InnoDB取代MyISAM的重要原因之一。
在这篇文章中,将以InnoDB为例,深入研究MySQL对事务支持的具体实现,并根据这些原则提供实用的建议。希望这些案例研究能够加深您对MySQL事务原理的理解。
当提到事务时,ACID(原子性、一致性、隔离性、持久性)肯定是我们首先想到的一个术语。今天,我们将深入研究其中一个方面,即ACID的Isolation隔离性。
当多个事务在数据库上同时运行时,可能会导致诸如脏读,不可重复读和幻读之类的问题。
为了解决这些问题,引入了隔离级别的概念。
我们要清楚的是,隔离级别越高,执行效率就越低。因此,很多时候我们需要在两者之间取得平衡。
SQL标准定义了四种事务隔离级别:
已提交读和可重复读的隔离级别确实有点难以掌握。
为了帮助说明这些隔离级别,让我们考虑一个示例。假设我们有一个数据表 T,只有一列和一行包含值1。
mysql > create table test_table(id int ) engine = InnoDB;
mysql > insert test_table(id) values ( 1 ) ;
以下是按时间顺序执行的两个事务的行为:
现在我们看看在不同隔离级别下会产生的不同结果,以及场景中V1、V2和 V3的值是什么。
在实现上,数据库创建一个视图,访问是基于这个视图的逻辑结果。
在可重复读隔离级别中,该视图在事务开始时创建,并在整个事务中使用。
在读已提交隔离级别中,此视图是在每个 SQL 语句执行开始时创建的。
值得注意的是,读未提交隔离级别直接返回记录上的最新值,没有视图的概念,而序列化隔离级别则采用锁定来直接防止并发访问。
很明显,不同隔离级别下的数据库行为有所不同。事实上,Oracle 的默认隔离级别是已提交读。因此,对于从Oracle 迁移到MySQL 的应用程序来说,MySQL为了保持数据库隔离级别的一致性,必须记住将 MySQL 的隔离级别设置为“已提交读”。
我们先深入研究可重复读隔离级别的细节。
在MySQL中,实际上,每条记录在更新时都伴随有一条回滚记录。可以通过使用此回滚记录访问先前的状态来获取记录上的最新值。
假设某个值依次从1过渡到2、3、4。在回滚日志中,您会发现类似以下的记录:
当前值为4,但是查询这条记录时,不同时间开始的事务会有不同的read-views。
如图所示,在read-views 1、2 和 3中,该记录的值分别为1、2和4。同一条记录在系统中可以有多个版本,这称为多版本并发控制(MVCC)。
Read-View 1如果想获取 value 1,必须按顺序执行 图中所示的所有回滚操作。
此外,即使当前有另一个事务更改4为5,该事务也不会与与读取视图 1、2 和 3 关联的事务发生冲突。
您可能想知道回滚日志何时被删除,因为它们不能无限期地保留。答案是当不再需要它们时将其删除。
换句话说,当没有事务需要访问回滚日志时,系统将确定可以删除它们。
什么时候不再需要它们?当系统中没有早于回滚日志的读取视图时会将他们删除。
基于上面提供的解释,我们来讨论一下为什么建议尽可能避免长时间运行的事务。
长时间运行的事务会导致系统中出现非常多旧的事务视图。由于这些事务可以随时访问数据库中的任何数据,因此它们可能需要的所有回滚记录都必须保留在数据库中,直到事务提交为止。这反过来又导致大量的存储空间消耗。
在 MySQL 5.5 之前的版本中,回滚日志与数据字典一起存储在 ibdata 文件中。即使长时间运行的事务最终提交并且回滚段被清除,文件大小也不会减少。
长时间运行的事务还会占用锁资源,并有可能影响整个数据库的性能。
如前所述,长时间运行的交易存在潜在风险,因此强烈建议尽可能避免它们。
在许多情况下,开发人员并没有故意使用长时间运行的事务;通常,这是由于误用造成的。
MySQL提供了几种发起事务的方式:
SET AUTOCOMMIT=0某些客户端连接框架可能会在连接成功后默认执行命令。
这会导致后续查询位于事务内,如果连接长时间保持打开状态,则可能会导致意外的长时间运行事务。
因此,建议通过语句SET AUTOCOMMIT=1显式使用和启动事务。