从0开始带你成为MySQL实战高手14 当我们更新Buffer Pool中的数据时,flush链表有什么用.pdf
图文14当我们更新BufferPool中的数据时,flush链表有什么用?手机观看
205人次阅读2020-02-0709:07:35
详情评论
当我们更新BufferPool中的数据时,flush链表有什么用?
如何提问:每篇文章都有评论区,大家可以尽情留言提问,我会逐一答疑
如何加群:购买狸猫技术窝专栏的小伙伴都可以加入狸猫技术交流群,一个非常纯粹的技术交流的地方
具体加群方式,请参见目录菜单下的文档:《MySQL专栏付费用户如何加群》(购买后可见)
1、昨日思考题解答
我们先解答一下昨日的思考题,昨天是问了大家一个问题,BufferPool中会不会有内存碎片?
答案是:当然有
因为BufferPool大小是你自己定的,很可能BufferPool划分完全部的缓存页和描述数据块之后,还剩一点点的内存,这一点
点的内存放不下任何一个缓存页了,所以这点内存就只能放着不能用,这就是内存碎片。
那怎么减少内存碎片呢?
其实也很简单,数据库在BufferPool中划分缓存页的时候,会让所有的缓存页和描述数据块都紧密的挨在一起,这样尽可能减
少内存浪费,就可以尽可能的减少内存碎片的产生了。
如果你的BufferPool里的缓存页是东一块西一块,那么必然导致缓存页的内存之间有很多内存空隙,这就会有大量的内存碎片
了。
2、脏数据页到底为什么会脏?
接着我们看一个很关键的问题,你在执行增删改的时候,如果发现数据页没缓存,那么必然会基于free链表找到一个空闲的缓
存页,然后读取到缓存页里去,但是如果已经缓存了,那么下一次就必然会直接使用缓存页。
反正不管怎么样,你要更新的数据页都会在BufferPool的缓存页里,供你在内存中直接执行增删改的操作。
接着你肯定会去更新BufferPool的缓存页中的数据,此时一旦你更新了缓存页中的数据,那么缓存页里的数据和磁盘上的数据
页里的数据,是不是就不一致了?
这个时候,我们就说缓存页是脏数据,脏页
3、哪些缓存页是脏页呢?
其实通过之前的学习,我们都是知道一点的,最终这些在内存里更新的脏页的数据,都是要被刷新回磁盘文件的。
但是这里就有一个问题了,不可能所有的缓存页都刷回磁盘的,因为有的缓存页可能是因为查询的时候被读取到BufferPool里
去的,可能根本没修改过!
所以数据库在这里引入了另外一个跟free链表类似的flush链表,这个flush链表本质也是通过缓存页的描述数据块中的两个指
针,让被修改过的缓存页的描述数据块,组成一个双向链表。
凡是被修改过的缓存页,都会把他的描述数据块加入到flush链表中去,flush的意思就是这些都是脏页,后续都是要flush刷新
到磁盘上去的
所以flush链表的结构如下图所示,跟free链表几乎是一样的。
4、flush链表构造的伪代码演示
我们用一些伪代码来给大家展示一下这个flush链表的构造过程,比如现在缓存页01被修改了数据,那么他就是脏页了,此时
就必须把他加入到flush链表中去
此时缓存页01的描述数据块假设如下所示
好了,我们可以看到,现在flush链表的基础节点就指向了一个block01的节点,接着比如缓存页02被更新了,他也是脏页了,
此时他的描述数据块也要被加入到flush链表中去
此时伪代码如下:
大家可以看到,当你更新缓存页的时候,通过变换缓存页中的描述数据块的flush链表的指针,就可以把脏页的描述数据块组成
一个双向链表,也就是flush链表,而且flush链表的基础节点会指向起始节点和尾巴节点。
通过这个flush链表,就可以记录下来哪些缓存页是脏页了!
End
专栏版权归公众号狸猫技术窝所有
未经许可不得传播,如有侵权将追究法律责任
狸猫技术窝精品专栏及课程推荐:
《从零开始带你成为消息中间件实战高手》
《21天互联网Java进阶面试训练营》(分布式篇)
《互联网Java工程师面试突击》(第1季)
《互联网Java工程师面试突击》(第3季)
《从零开始带你成为JVM实战高手》