MySQL数据库入门到精通7--进阶篇( InnoDB引擎)-CSDN博客

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

6. InnoDB引擎

6.1 逻辑存储结构

InnoDB的逻辑存储结构如下图所示:
在这里插入图片描述
1). 表空间
表空间是InnoDB存储引擎逻辑结构的最高层如果用户启用了参数 innodb_file_per_table(在
8.0版本中默认开启) 则每张表都会有一个表空间xxx.ibd一个mysql实例可以对应多个表空
间用于存储记录、索引等数据。
2). 段
段分为数据段Leaf node segment、索引段Non-leaf node segment、回滚段
Rollback segmentInnoDB是索引组织表数据段就是B+树的叶子节点索引段即为B+树的
非叶子节点。段用来管理多个Extent区。
3). 区
区表空间的单元结构每个区的大小为1M。默认情况下 InnoDB存储引擎页大小为16K 即一
个区中一共有64个连续的页。
4). 页
页是InnoDB 存储引擎磁盘管理的最小单元每个页的大小默认为 16KB。为了保证页的连续性
InnoDB 存储引擎每次从磁盘申请 4-5 个区。
5). 行
行InnoDB 存储引擎数据是按行进行存放的。
在行中默认有两个隐藏字段
Trx_id每次对某条记录进行改动时都会把对应的事务id赋值给trx_id隐藏列。
Roll_pointer每次对某条引记录进行改动时都会把旧的版本写入到undo日志中然后这个
隐藏列就相当于一个指针可以通过它来找到该记录修改前的信息。

6.2 架构

6.2.1 概述
MySQL5.5 版本开始默认使用InnoDB存储引擎它擅长事务处理具有崩溃恢复特性在日常开发
中使用非常广泛。下面是InnoDB架构图左侧为内存结构右侧为磁盘结构。
在这里插入图片描述
6.2.2 内存结构

在左侧的内存结构中主要分为这么四大块儿 Buffer Pool、Change Buffer、Adaptive
Hash Index、Log Buffer。接下来介绍一下这四个部分。
1). Buffer Pool
InnoDB存储引擎基于磁盘文件存储访问物理硬盘和在内存中进行访问速度相差很大为了尽可能
弥补这两者之间的I/O效率的差值就需要把经常使用的数据加载到缓冲池中避免每次访问都进行磁
盘I/O。
在InnoDB的缓冲池中不仅缓存了索引页和数据页还包含了undo页、插入缓存、自适应哈希索引以及InnoDB的锁信息等等。
缓冲池 Buffer Pool是主内存中的一个区域里面可以缓存磁盘上经常操作的真实数据在执行增
删改查操作时先操作缓冲池中的数据若缓冲池没有数据则从磁盘加载并缓存然后再以一定频率刷新到磁盘从而减少磁盘IO加快处理速度。
缓冲池以Page页为单位底层采用链表数据结构管理Page。根据状态将Page分为三种类型
• free page空闲page未被使用。
• clean page被使用page数据没有被修改过。
• dirty page脏页被使用page数据被修改过也中数据与磁盘的数据产生了不一致。
在专用服务器上通常将多达80的物理内存分配给缓冲池。参数设置 show variables
like ‘innodb_buffer_pool_size’;
2). Change Buffer
Change Buffer更改缓冲区针对于非唯一二级索引页在执行DML语句时如果这些数据Page
没有在Buffer Pool中不会直接操作磁盘而会将数据变更存在更改缓冲区 Change Buffer
中在未来数据被读取时再将数据合并恢复到Buffer Pool中再将合并后的数据刷新到磁盘中。
Change Buffer的意义是什么呢?
先来看一幅图这个是二级索引的结构图
在这里插入图片描述
与聚集索引不同二级索引通常是非唯一的并且以相对随机的顺序插入二级索引。同样删除和更新可能会影响索引树中不相邻的二级索引页如果每一次都操作磁盘会造成大量的磁盘IO。有了
ChangeBuffer之后我们可以在缓冲池中进行合并处理减少磁盘IO。
3). Adaptive Hash Index
自适应hash索引用于优化对Buffer Pool数据的查询。MySQL的innoDB引擎中虽然没有直接支持
hash索引但是给我们提供了一个功能就是这个自适应hash索引。因为前面我们讲到过hash索引在进行等值匹配时一般性能是要高于B+树的因为hash索引一般只需要一次IO即可而B+树可能需要几次匹配所以hash索引的效率要高但是hash索引又不适合做范围查询、模糊匹配等。
InnoDB存储引擎会监控对表上各索引页的查询如果观察到在特定的条件下hash索引可以提升速度则建立hash索引称之为自适应hash索引
自适应哈希索引无需人工干预是系统根据情况自动完成。
参数 adaptive_hash_index
4). Log Buffer
Log Buffer日志缓冲区用来保存要写入到磁盘中的log日志数据redo log 、undo log
默认大小为 16MB日志缓冲区的日志会定期刷新到磁盘中。如果需要更新、插入或删除许多行的事
务增加日志缓冲区的大小可以节省磁盘 I/O。
参数:
innodb_log_buffer_size缓冲区大小
innodb_flush_log_at_trx_commit日志刷新到磁盘时机取值主要包含以下三个
1: 日志在每次事务提交时写入并刷新到磁盘默认值。
0: 每秒将日志写入并刷新到磁盘一次。
2: 日志在每次事务提交后写入并每秒刷新到磁盘一次。
6.2.3 磁盘结构
接下来再来看看InnoDB体系结构的右边部分也就是磁盘结构
在这里插入图片描述
1). System Tablespace
系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创建
的它也可能包含表和索引数据。(在MySQL5.x版本中还包含InnoDB数据字典、undolog等)
参数innodb_data_file_path
在这里插入图片描述
系统表空间默认的文件名叫 ibdata1。
2). File-Per-Table Tablespaces
如果开启了innodb_file_per_table开关则每个表的文件表空间包含单个InnoDB表的数据和索引并存储在文件系统上的单个数据文件中。
开关参数innodb_file_per_table 该参数默认开启。
在这里插入图片描述
那也就是说我们每创建一个表都会产生一个表空间文件如图

3). General Tablespaces
通用表空间需要通过 CREATE TABLESPACE 语法创建通用表空间在创建表时可以指定该表空
间。
A. 创建表空间

CREATE TABLESPACE ts_name ADD DATAFILE 'file_name' ENGINE = engine_name;

B. 创建表时指定表空间

CREATE TABLE xxx ... TABLESPACE ts_name;

4). Undo Tablespaces
撤销表空间MySQL实例在初始化时会自动创建两个默认的undo表空间初始大小16M用于存储undo log日志。
5). Temporary Tablespaces
InnoDB 使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据。
6). Doublewrite Buffer Files
双写缓冲区innoDB引擎将数据页从Buffer Pool刷新到磁盘前先将数据页写入双写缓冲区文件
中便于系统异常时恢复数据。
在这里插入图片描述
7). Redo Log
重做日志是用来实现事务的持久性。该日志文件由两部分组成重做日志缓冲redo log
buffer以及重做日志文件redo log,前者是在内存中后者在磁盘中。当事务提交之后会把所
有修改信息都会存到该日志中, 用于在刷新脏页到磁盘时,发生错误时, 进行数据恢复使用。
以循环方式写入重做日志文件涉及两个文件
在这里插入图片描述
前面我们介绍了InnoDB的内存结构以及磁盘结构那么内存中我们所更新的数据又是如何到磁盘
中的呢此时就涉及到一组后台线程接下来就来介绍一些InnoDB中涉及到的后台线程。

6.2.4 后台线程

在InnoDB的后台线程中分为4类分别是Master Thread 、IO Thread、Purge Thread、
Page Cleaner Thread。
1). Master Thread
核心后台线程负责调度其他线程还负责将缓冲池中的数据异步刷新到磁盘中, 保持数据的一致性还包括脏页的刷新、合并插入缓存、undo页的回收。
2). IO Thread
在InnoDB存储引擎中大量使用了AIO来处理IO请求, 这样可以极大地提高数据库的性能而IO
Thread主要负责这些IO请求的回调。
在这里插入图片描述
3). Purge Thread
主要用于回收事务已经提交了的undo log在事务提交之后undo log可能不用了就用它来回收。
4). Page Cleaner Thread
协助 Master Thread 刷新脏页到磁盘的线程它可以减轻 Master Thread 的工作压力减少阻塞。

6.3 事务原理

6.3.1 事务基础
1). 事务
事务是一组操作的集合它是一个不可分割的工作单位事务会把所有的操作作为一个整体一起向系
统提交或撤销操作请求即这些操作要么同时成功要么同时失败。
2). 特性
• 原子性Atomicity事务是不可分割的最小操作单元要么全部成功要么全部失败。
• 一致性Consistency事务完成时必须使所有的数据都保持一致状态。
• 隔离性Isolation数据库系统提供的隔离机制保证事务在不受外部并发操作影响的独立环
境下运行。
• 持久性Durability事务一旦提交或回滚它对数据库中的数据的改变就是永久的。
那实际上我们研究事务的原理就是研究MySQL的InnoDB引擎是如何保证事务的这四大特性的。
在这里插入图片描述
而对于这四大特性实际上分为两个部分。其中的原子性、一致性、持久化实际上是由InnoDB中的两份日志来保证的一份是redo log日志一份是undo log日志。而持久性是通过数据库的锁
加上MVCC来保证的。

我们在讲解事务原理的时候主要就是来研究一下redologundolog以及MVCC
6.3.2 redo log
重做日志记录的是事务提交时数据页的物理修改是用来实现事务的持久性。
该日志文件由两部分组成重做日志缓冲redo log buffer以及重做日志文件redo log file,前者是在内存中后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用。
如果没有redolog可能会存在什么问题的我们一起来分析一下。
我们知道在InnoDB引擎中的内存结构中主要的内存区域就是缓冲池在缓冲池中缓存了很多的数
据页。当我们在一个事务中执行多个增删改的操作时InnoDB引擎会先操作缓冲池中的数据如果缓冲区没有对应的数据会通过后台线程将磁盘中的数据加载出来存放在缓冲区中然后将缓冲池中的数据修改修改后的数据页我们称为脏页。而脏页则会在一定的时机通过后台线程刷新到磁盘中从而保证缓冲区与磁盘的数据一致。而缓冲区的脏页数据并不是实时刷新的而是一段时间之后将缓冲区的数据刷新到磁盘中假如刷新到磁盘的过程出错了而提示给用户事务提交成功而数据却没有持久化下来这就出现问题了没有保证事务的持久性。
在这里插入图片描述
那么如何解决上述的问题呢在InnoDB中提供了一份日志 redo log接下来我们再来分析一
下通过redolog如何解决这个问题。

有了redolog之后当对缓冲区的数据进行增删改之后会首先将操作的数据页的变化记录在redo
log buffer中。在事务提交时会将redo log buffer中的数据刷新到redo log磁盘文件中。过一段时间之后如果刷新缓冲区的脏页到磁盘时发生错误此时就可以借助于redo log进行数据恢复这样就保证了事务的持久性。而如果脏页成功刷新到磁盘或或者涉及到的数据已经落盘此时redolog就没有作用了就可以删除了所以存在的两个redolog文件是循环写的。
那为什么每一次提交事务要刷新redo log 到磁盘中呢而不是直接将buffer pool中的脏页刷新
到磁盘呢 ?
因为在业务操作中我们操作数据一般都是随机读写磁盘的而不是顺序读写磁盘。而redo log在
往磁盘文件中写入数据由于是日志文件所以都是顺序写的。顺序写的效率要远大于随机写。这
种先写日志的方式称之为 WALWrite-Ahead Logging。
6.3.3 undo log
回滚日志用于记录数据被修改前的信息 , 作用包含两个 : 提供回滚(保证事务的原子性) 和
MVCC(多版本并发控制) 。
undo log和redo log记录物理日志不一样它是逻辑日志。可以认为当delete一条记录时undo
log中会记录一条对应的insert记录反之亦然当update一条记录时它记录一条对应相反的
update记录。当执行rollback时就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。
Undo log销毁undo log在事务执行时产生事务提交时并不会立即删除undo log因为这些
日志可能还用于MVCC。
Undo log存储undo log采用段的方式进行管理和记录存放在前面介绍的 rollback segment
回滚段中内部包含1024个undo log segment。

6.4 MVCC

6.4.1 基本概念
1). 当前读
读取的是记录的最新版本读取时还要保证其他并发事务不能修改当前记录会对读取的记录进行加
锁。对于我们日常的操作如select … lock in share mode(共享锁)select …
for update、update、insert、delete(排他锁)都是一种当前读。
测试
在这里插入图片描述
在测试中我们可以看到即使是在默认的RR隔离级别下事务A中依然可以读取到事务B最新提交的内容因为在查询语句后面加上了 lock in share mode 共享锁此时是当前读操作。当然当我们
加排他锁的时候也是当前读操作。
2). 快照读
简单的select不加锁就是快照读快照读读取的是记录数据的可见版本有可能是历史数据
不加锁是非阻塞读。
• Read Committed每次select都生成一个快照读。
• Repeatable Read开启事务后第一个select语句才是快照读的地方。
• Serializable快照读会退化为当前读。
测试:
在这里插入图片描述
在测试中,我们看到即使事务B提交了数据,事务A中也查询不到。原因就是因为普通的select是快照
读而在当前默认的RR隔离级别下开启事务后第一个select语句才是快照读的地方后面执行相同
的select语句都是从快照中获取数据可能不是当前的最新数据这样也就保证了可重复读。
3). MVCC
全称 Multi-Version Concurrency Control多版本并发控制。指维护一个数据的多个版本
使得读写操作没有冲突快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView。接下来我们再来介绍一下InnoDB引擎的表中涉及到的隐藏字段、undolog 以及 readview从而来介绍一下MVCC的原理。
6.4.2 隐藏字段
6.4.2.1 介绍
在这里插入图片描述
当我们创建了上面的这张表我们在查看表结构的时候就可以显式的看到这三个字段。实际上除了
这三个字段以外InnoDB还会自动的给我们添加三个隐藏字段及其含义分别是

而上述的前两个字段是肯定会添加的是否添加最后一个字段DB_ROW_ID得看当前表有没有主键如果有主键则不会添加该隐藏字段。
6.4.2.2 测试
1). 查看有主键的表 stu
进入服务器中的 /var/lib/mysql/itcast/ , 查看stu的表结构信息, 通过如下指令:

ibd2sdi stu.ibd

查看到的表结构信息中有一栏 columns在其中我们会看到处理我们建表时指定的字段以外还有
额外的两个字段分别是DB_TRX_ID 、 DB_ROLL_PTR 因为该表有主键所以没DB_ROW_ID
隐藏字段。
2). 查看没有主键的表 employee
建表语句

create table employee (id int , name varchar(10));

此时我们再通过以下指令来查看表结构及其其中的字段信息

ibd2sdi employee.ibd

查看到的表结构信息中有一栏 columns在其中我们会看到处理我们建表时指定的字段以外还有
额外的三个字段分别是DB_TRX_ID 、 DB_ROLL_PTR 、DB_ROW_ID因为employee表是没有
指定主键的。
6.4.3 undolog
6.4.3.1 介绍
回滚日志在insert、update、delete的时候产生的便于数据回滚的日志。
当insert的时候产生的undo log日志只在回滚时需要在事务提交后可被立即删除。
而update、delete的时候产生的undo log日志不仅在回滚时需要在快照读时也需要不会立即
被删除。
6.4.3.2 版本链
有一张表原始数据为
在这里插入图片描述
DB_TRX_ID : 代表最近修改事务ID记录插入这条记录或最后一次修改该记录的事务ID是自增的。
DB_ROLL_PTR 由于这条数据是才插入的没有被更新过所以该字段值为null。
然后有四个并发事务同时在访问这张表。
A. 第一步
在这里插入图片描述
当事务2执行第一条修改语句时会记录undo log日志记录数据变更之前的样子; 然后更新记录
并且记录本次操作的事务ID回滚指针回滚指针用来指定如果发生回滚回滚到哪一个版本。

B.第二步

当事务3执行第一条修改语句时也会记录undo log日志记录数据变更之前的样子; 然后更新记
录并且记录本次操作的事务ID回滚指针回滚指针用来指定如果发生回滚回滚到哪一个版本。
在这里插入图片描述
C. 第三步

当事务4执行第一条修改语句时也会记录undo log日志记录数据变更之前的样子; 然后更新记
录并且记录本次操作的事务ID回滚指针回滚指针用来指定如果发生回滚回滚到哪一个版本。

最终我们发现不同事务或相同事务对同一条记录进行修改会导致该记录的undolog生成一条
记录版本链表链表的头部是最新的旧记录链表尾部是最早的旧记录。
6.4.4 readview
ReadView读视图是快照读 SQL执行时MVCC提取数据的依据记录并维护系统当前活跃的事务
未提交的id。
ReadView中包含了四个核心字段
在这里插入图片描述
而在readview中就规定了版本链数据的访问规则
trx_id 代表当前undolog版本链对应事务ID。

不同的隔离级别生成ReadView的时机不同
READ COMMITTED 在事务中每一次执行快照读时生成ReadView。
REPEATABLE READ仅在事务中第一次执行快照读时生成ReadView后续复用该ReadView。
6.4.5 原理分析
6.4.5.1 RC隔离级别
RC隔离级别下在事务中每一次执行快照读时生成ReadView。
我们就来分析事务5中两次快照读读取数据是如何获取数据的?
在事务5中查询了两次id为30的记录由于隔离级别为Read Committed所以每一次进行快照读
都会生成一个ReadView那么两次生成的ReadView如下。
在这里插入图片描述
那么这两次快照读在获取数据时就需要根据所生成的ReadView以及ReadView的版本链访问规则
到undolog版本链中匹配数据最终决定此次快照读返回的数据。
A. 先来看第一次快照读具体的读取过程

在进行匹配时会从undo log的版本链从上到下进行挨个匹配
先匹配在这里插入图片描述
这条记录这条记录对应的trx_id为4也就是将4带入右侧的匹配规则中。 ①不满足 ②不满足 ③不满足 ④也不满足都不满足则继续匹配undo log版本链的下一条。
再匹配第二条

这条记录对应的trx_id为3也就是将3带入右侧的匹配规则中。①不满足 ②不满足 ③不满足 ④也
不满足都不满足则继续匹配undo log版本链的下一条。
再匹配第三条在这里插入图片描述
这条记录对应的trx_id为2也就是将2带入右侧的匹配规则中。①不满足 ②满足终止匹配此次快照读返回的数据就是版本链中记录的这条数据。
B. 再来看第二次快照读具体的读取过程:

在进行匹配时会从undo log的版本链从上到下进行挨个匹配
先匹配
在这里插入图片描述
这条记录这条记录对应的trx_id为4也就是将4带入右侧的匹配规则中。 ①不满足 ②不满足 ③不满足 ④也不满足都不满足则继续匹配undo log版本链的下一条。
再匹配第二条

这条记录对应的trx_id为3也就是将3带入右侧的匹配规则中。①不满足 ②满足。终止匹配此次
快照读返回的数据就是版本链中记录的这条数据。
6.4.5.3 RR隔离级别
RR隔离级别下仅在事务中第一次执行快照读时生成ReadView后续复用该ReadView。而RR 是可重复读在一个事务中执行两次相同的select语句查询到的结果是一样的。
那MySQL是如何做到可重复读的呢? 我们简单分析一下就知道了
在这里插入图片描述
我们看到在RR隔离级别下只是在事务中第一次快照读时生成ReadView后续都是复用该
ReadView那么既然ReadView都一样 ReadView的版本链匹配规则也一样那么最终快照读返
回的结果也是一样的。
所以呢MVCC的实现原理就是通过 InnoDB表的隐藏字段、UndoLog 版本链、ReadView来实现的。
而MVCC + 锁则实现了事务的隔离性。而一致性则是由redolog 与 undolog保证。
在这里插入图片描述