Braft的日志存储引擎实现分析

Braft的日志存储引擎实现分析

1.架构设计

1.1 函数接口说明

日志存储引擎是用于存储raft lib产生的日志。提供的接口如下:

class LogStorage {
public:
    virtual ~LogStorage() {}

    // init logstorage, check consistency and integrity
    virtual int init(ConfigurationManager* configuration_manager) = 0;

    // first log index in log
    virtual int64_t first_log_index() = 0;

    // last log index in log
    virtual int64_t last_log_index() = 0;

    // get logentry by index
    virtual LogEntry* get_entry(const int64_t index) = 0;

    // get logentry's term by index
    virtual int64_t get_term(const int64_t index) = 0;

    // append entries to log
    virtual int append_entry(const LogEntry* entry) = 0;

    // append entries to log, return append success number
    virtual int append_entries(const std::vector<LogEntry*>& entries) = 0;

    // delete logs from storage's head, [first_log_index, first_index_kept) will be discarded
    virtual int truncate_prefix(const int64_t first_index_kept) = 0;

    // delete uncommitted logs from storage's tail, (last_index_kept, last_log_index] will be discarded
    virtual int truncate_suffix(const int64_t last_index_kept) = 0;

    // Drop all the existing logs and reset next log index to |next_log_index|.
    // This function is called after installing snapshot from leader
    virtual int reset(const int64_t next_log_index) = 0;

    // Create an instance of this kind of LogStorage with the parameters encoded 
    // in |uri|
    // Return the address referenced to the instance on success, NULL otherwise.
    virtual LogStorage* new_instance(const std::string& uri) const = 0;

    static LogStorage* create(const std::string& uri);
};

LogStorage只是一个抽象类,只定义了函数接口。具体的日志操作由SegmentLogStorage实现。

1.2 存储引擎的数据组织

SegmentLogStorage实现了LogStorage的全部接口。其数据组织格式如下:


image.png
  • segment名字为first_raft_index-last_raft_index,表示该segment的raft index范围。
  • 只有最后一个segment可读写,其文件名为log_inprogress_first_raft_index,其他segment只读。
  • segment文件对应的index entry,Segment文件初始化时构造出来,存储在内存中。不会持久化到磁盘。因此追加一次Log Entry只会引起一次磁盘操作。

2.核心流程实现

2.1 存储引擎的接口函数

2.2 存储引擎的初始化

存储引擎的初始化操作主要检查文件信息,将segment的索引信息加载到内存,为读写操作做准备。


image.png

函数主要功能如下所述:

  • init函数是SegmentLogStorage初始化的入口函数,调用load_meta函数,list_segment函数和load_segment函数。
  • load_meta函数:从log_meta文件中读取从SegmentLogStorage的第一个raft index值。
  • list_segment函数:建立起segment的范围信息,并将范围异常的segment文件删除。范围信息存储在一个map表中,map的key是first_raft_index,value是segment对象。
  • load_segments函数:构建出每个segment对应的索引项,通过解析segement内容完成。索引项存储在一个vector中。至此,就可以根据范围信息来定位到某个raft_index对应的文件偏移。

2.3 写数据流程

写数据到存储引擎,会涉及到两个函数:

 // append entry to log
    int append_entry(const LogEntry* entry);
 // append entries to log, return success append number
   int append_entries(const std::vector<LogEntry*>& entries);

append_entry表示追加单条Log Entry到日志存储引擎,append_entries用于同时追加多条Log Entry到日志存储引擎。两个函数主要流程相差不大,我们以append_entries为例,分析一下写入Log Entry的主要流程。函数流程图如下所示:


image.png
  • 检查日志连续性:主要检查last_raft_index 是否和追加的Log Entry保持连续。
  • 获取Last_Segment:检查last_segment是否超过Max_Segment_Size,如果超过则进行rolling操作(保存最后一个segment,并生成一个新的segment)。如果文件大小未超过Max_Segment_Size,则直接返回。
  • 循环追加日志:追加Log Entry到文件末尾。
  • Last_Segment强制刷盘:调用fsync函数强制刷盘。

2.4 读数据流程

根据raft_index读取对应的raft Log,根据我们前面提到的索引信息,braft很容易实现,流程图如下所示:


image.png

get_entry是入口函数,get_segment函数主要是通过raft_index来定位到segment,通过之前建立的Map范围信息很容易定位到。然后根据每个segment的Vector索引数组,定位到raft_index对应的文件偏移信息。然后读取文件。

2.5 删除数据流程

删除数据分为两类:

  • 从前往后删除,对应的函数是:
SegmentLogStorage::truncate_prefix(const int64_t first_index_kept)

truncate_prefix函数先将first_index_kept保存到Log_meta文件中,这样保证了即使后续的文件删除操作失败时,也可以知道整个日志的起始raft_index是多少。保存完first_index_kept之后,将first_index_kept之前的segment文件全部删除。

  • 从后往前删除,对应的函数是:
int SegmentLogStorage::truncate_suffix(const int64_t last_index_kept) 

主要用于raft lib中删除未达成一致的Log Entry。根据last_index_kept找到对应的文件偏移,然后截断文件。如果跨文件,还需要删除最后一个segment文件,然后再截断之前一个segment的内容。

3.测试

在test/test_log.cpp文件中,包含SegmentLogStorage类中主要的接口函数的单元测试,对理解SegmentLogStorage有比较大的帮助。

4.总结

Braft的日志存储引擎,主要用于存储raft log。当执行完一次snapshot操作后,就可以进行Log Compaction。将snapshot之前的raft log全部删除。这使得Braft可以将Log的索引信息全部存储在内存中,因为存储引擎中的Raft Log Entry不会太大。这样追加或读取Raft Log只需要一次磁盘操作,性能方面有保证。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容