leveldb(3) 元数据

元数据作用

Hbase有存储在zookeeper的metadata来定位RegionServer,

而LevelDB也通过元数据管理模块去感知每一层有哪些SST文件;快速的定位某条数据所在的SST文件;以及重启后恢复到之前的状态。

作用概括如下:

  • 记录Compaction相关信息,使得Compaction过程能在需要的时候被触发;

  • 维护SST文件索引信息及层次信息,为整个LevelDB的读、写、Compaction提供数据结构支持;

  • 负责元信息数据的持久化,使得整个库可以从进程重启或机器宕机中恢复到正确的状态;

  • 记录LogNumber,Sequence,下一个SST文件编号等状态信息;

  • 以版本的方式维护元信息,使得Leveldb内部或外部用户可以以快照的方式使用文件和数据。

实现

LeveDB用Version表示一个版本的元信息,Version中主要包括一个FileMetaData指针的二维数组,分层记录了所有的SST文件信息。FileMetaData数据结构用来维护一个文件的元信息,包括文件大小,文件编号,最大最小值,引用计数等,其中引用计数记录了被不同的Version引用的个数,保证被引用中的文件不会被删除。

VersionSet是一个Version构成的双向链表,这些Version按时间顺序先后产生,记录了当时的元信息,链表头指向当前最新的Version,同时维护了每个Version的引用计数,被引用中的Version不会被删除,其对应的SST文件也因此得以保留,通过这种方式,使得LevelDB可以在一个稳定的快照视图上访问文件。VersionSet中除了Version的双向链表外还会记录一些如LogNumber,Sequence,下一个SST文件编号的状态信息。

image

Version更新

leveldb中只要文件变动应用在旧的Version上可以得到新的Version。而这个更新信息都保存在VersionEdit中。

即:

Version N + VersionEdit = Version N+1

进程崩溃以及恢复

为了避免进程崩溃或机器宕机导致的数据丢失,LevelDB需要将元信息数据持久化到磁盘,承担这个任务的就是Manifest文件。可以看出每当有新的Version产生都需要更新Manifest,很自然的发现这个新增数据正好对应于VersionEdit内容。

在Manifest中的一次增量内容称作一个Block,其内容如下:

Manifest Block := N * Item
Item := [kComparator] comparator
 or [kLogNumber] 64位log_number
 or [kPrevLogNumber] 64位pre_log_number
 or [kNextFileNumber] 64位next_file_number_
 or [kLastSequence] 64位last_sequence_
 or [kCompactPointer] 32位level + 变长的key
 or [kDeletedFile] 32位level + 64位文件号
 or [kNewFile] 32位level + 64位 文件号 + 64位文件长度 + smallest key + largest key</pre>

last_sequence

记录了向leveldb中写入的记录总数,写数据时被使用

WriteBatchInternal::SetSequence(updates, last_sequence + 1);//对WriteBatch的序号+1
last_sequence += WriteBatchInternal::Count(updates);//加上此次写入的记录数,即为此时已经写入的记录总数
/* ...... */
versions_->SetLastSequence(last_sequence);//将其保存在VersionSet中</pre>
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 版本控制或元信息管理,是LevelDB中比较重要的内容。本文首先介绍其在整个LevelDB中不可替代的作用;之后从...
    CatKang阅读 10,885评论 12 12
  • LevelDB是Google传奇工程师Jeff Dean和Sanjay Ghemawat开源的KV存储引擎,无论从...
    CatKang阅读 10,376评论 5 25
  • 前面写了两篇文章介绍 LevelDB 的整体架构和接口使用。这篇文章,我们从代码的角度看看 LevelDB 的设计...
    linjinhe阅读 10,943评论 0 1
  • 最近项目中用到这个nb的玩意,所以就花时间研究了下,同时整理下助自己记忆。这个猛虎上山的logo就是rocksdb...
    小东_16d3阅读 13,113评论 3 10
  • SASS 是对 CSS 的扩展,是 CSS 的预编译语言,让 CSS 如虎添翼。它让你在编写 CSS 时可以使用变...
    一俢阅读 1,859评论 0 7

友情链接更多精彩内容