当发生转储和合并时多版本数据会被如何处理?
- 转储的时候会根据参数 undo_retention 来决定保留多久的多版本数据,默认 1800 秒,超出时间的多版本数据会在转储时删除,如果还有事务要读取被删除的版本,会失败。
- 不止转储时会删,mini minor merge、minor merge 时也会删超出undo_retention时间的多版本数据
- 在合并时,Major SSTable 只会保留最新版本的数据,并根据 undo_retention 的值来决定是否保留上层 Mini SSTable、Minor SSTable 中的多版本
这会带来一个问题:如果有一个事务需要读取旧版本数据,可能会因为多版本数据被清理了无法读取成功。
V4.1版本做调整,多版本数据上有一个引用计数器,当引用计数器为 0(也就是没有被任何事务读取)才会被删除。不过,数据盘满的场景是例外,此时还是会强制删除旧版本数据。
验证方法
下面设计一个实验进行验证(V3 版本):
- 先触发一次合并,并将 undo_retention 设置成一个较小的值
alter system set max_kept_major_version_number=1;
alter system major freeze;
set global undo_retention=120;
- session1 开启 serializable 隔离级别事务,查询表 tab_no_queue
set transaction_isolation='serializable';
start transaction;
select * from tab_no_queue where rownum<10;
- session2 更新表 tab_no_queue并提交
set transaction_isolation='serializable';
update tab_no_queue set ADDR='0' where mod(id,5) in (4);
commit;
- 等待 120 秒,session3 转储 tab_no_queue 表
alter system minor freeze partition_id='0%0@1100611139453789';
查看转储完成,并且只发生 mini merge(也就是将 memtable 写到磁盘的 mini sstable):- session1 再次执行同样的查询