2.5 Master Thread工作方式
InnoDB存储引擎的主要工作都是在一个单独的后台线程Master Thread中完成的。
2.5.1 InnoDB 1.0.x之前的Master Thread
Master Thread 具有最高的线程优先级别。其内部由多个循环(loop)组成:主循环(Loop),后台循环(backgroup loop),刷新循环(flush loop),暂停循环(suspend loop)。Master Thread会根据数据库的运行状态在多个loop中进行切换
Loop被称为主循环,因为大多数的操作是在这个循环中,其中有两个大部分的操作----每秒钟的操作和每十秒钟的操作。
每秒一次的操作包括
- 日志缓冲刷新到磁盘,即使这个事务还没有提交(总是)
- 合并插入缓冲(总是)
- 至多刷新100个InnoDB的缓冲池中的脏页到磁盘(可能)
- 如果当前没有用户活动,则切换到background loop(可能)
即使某个事务还没有提交,InnoDB存储引擎仍然每秒会将重做日志缓冲的内容刷新到重做日志文件。这可以很好解释为什么再大的事务提交的时间也是很短的
合并插入缓冲(Insert Buffer)并不是每秒都会发生。InnoDB存储引擎会判断当前一秒内发生的IO次数是否小于5次,如果小于5次,引擎会认为当前IO压力很小,执行执行合并插入缓冲操作
刷新100个脏页也不是每秒发生。引擎会判断当前缓冲池中脏页的比例是否超过了配置文件中的innodb_max_dirty_pages_pct的值
每十秒一次的操作包括
- 刷新100个脏页到磁盘(可能)
- 合并至多5个插入缓冲(总是)
- 将日志缓冲刷新到磁盘(总是)
- 删除无用的Undo页(总是)
- 刷新100个或者10个脏页到磁盘(总是)
InnoDB会判断过去10秒之内磁盘的IO操作是否小于200次,如果是,InnoDB存储引擎认为当前有足够的磁盘IO操作能力,因此将100个脏页刷新到磁盘。接着,InnoDB引擎会合并插入缓冲。然后将日志缓冲刷新到磁盘。接着InnoDB会进行full purge操作,即删除无用的Undo页。在对表进行update、delete这类操作的时候,原型的行被标记为删除(更新也是先删除之后再插入的),但是因为一致性读(consistent read)的关系,需要保留这些行的版本信息。但是在full purge过程中,InnoDB引擎会判断当前事务系统中已被删除的行是否可以删除,比如有时候还有查询操作需要读取之前版本的信息,如果可以删除,InnoDB会立即删除。然后InnoDB会判断缓冲池中脏页的比例(buf_get_modified_ratio_pct),如果有超过70%就刷新100个脏页到磁盘,如果小于70%,就只刷新10个脏页到磁盘
background loop
当前没有用户活动或者数据库关闭,就会切换到这个循环。background loop会执行如下操作:
a):删除无用的Undo页(总是)
b):合并20个插入缓冲(总是)
c):
跳回主循环(总是)
d):不断刷新100个页直到符合条件(可能,跳转到flush loop中完成)
flush loop
suspend loop
若在flush loop中没有什么事情可以做,InnoDB引擎会切换到 suspend loop,将Master Thread挂起,等待事件的发生。若用户启用了InnoDB引擎,却没有任何使用InnoDB引擎的表,那么Master Thread总是处于挂起状态
2.5.2 InnoDB 1.2.x之前的Master Thread
在InnoDB1.0.x之前,在缓冲池向磁盘刷新时做了一定的硬编码(hard coding),一些参数是固定的,比如合并插入缓冲和刷新脏页。在磁盘技术飞速发展的今天,这种规定在很大程度限制了InnoDB存储引擎对磁盘IO的性能。
从InnoDB1.0.x开始,提供了参数innodb_io_capacity,用来表示磁盘IO的吞吐量,默认值为200。对于刷新到磁盘页的数量,会按照innodb_io_capacity的百分比来进行控制。规则如下
- 在合并插入缓冲时,合并插入缓冲的数量为innodb_io_capacity值的5%
- 在从缓冲区刷新脏页时,刷新脏页的数量为innodb_io_capacity
另一个参数是innodb_max_dirty_pages_pct,在InnoDB1.0.x之前,该值默认为90,意味着脏页占缓冲池的90%。InnoDB在每秒刷新缓冲池和flush loop时会判断这个值,如果这个值大于innodb_max_dirty_pages_pct,才刷新100个脏页。如果有很大的内存,或者数据库服务器的压力很大,这是刷新脏页的速度反而会降低。同样,在数据库恢复阶段可能需要更多的时间。从InnoDB1.0.x开始,默认值为75%,这样既可以加快刷新脏页的频率,又能保证磁盘IO的速度
还有一个参数是innodb_adaptive_flushing(自适应地刷新),该值影响每秒刷新脏页的数量。原来的刷新规则是:脏页在缓冲池所占的比例小于innodb_max_dirty_pages_pct时,不刷新脏页;大于时,刷新100个脏页。随着innodb_adaptive_flushing参数的引入,InnoDB会通过一个名为buf_flush_get_desired_flush_rate的函数来判断需要刷新的脏页最适合的数量,该函数通过产生重做日志的速度来决定最适合的数量。因此当脏页比例小于innodb_max_dirty_pages_pct时,也会刷新一定量的脏页
还有一个改变是:之前每次进行full purge操作时,最多回收20个Undo页,InnoDB1.0.x开始引入了参数innodb_purge_batch_size,该参数可以控制每次full purge回收的数量。
2.5.3 InnoDB 1.2.x的Master Thread
InnoDB1.2.x再次对Master Thread做了优化。同时对于刷新脏页的操作,从Master Thread分离到了一个单独的Page Cleaner Thread线程,从而减轻了Master Thread的工作,同时进一步提高了系统的并发性能