LSM-tree 3.3 Multi-Component LSM-trees

翻译内容

3.3 Multi-Component LSM-trees

给定lsm -树的参数M被定义为在滚动合并期间插入到C1树的每个单页叶节点的C0树中的条目的平均数量。我们一直认为量M大于1,因为在合并到C1树的节点之前,新元素在C0树中积累的延迟时间。但是,从公式(3.2)可以清楚地看到,如果C1树相对于C0树非常大,或者条目非常大,只适合很小的数字到一页,数量M可能小于1。对于M的这样一个值意味着,对于从C0树合并进来的每个条目,平均必须有多个C1树页面进入或离开内存。在公式(3.4)中M非常小的情况下,特别是当M < K1。COSTπ/ cost,这甚至可以取消多页磁盘读取的批处理效果,所以我们最好使用普通的b树来代替lsm树来进行插入。(有道翻译)

为了避免M值偏小,唯一使用双分量lsm树的方法是相对于C1增大C0分量大小。考虑一个给定总叶条目大小S (S = S0 + S1,一个近似稳定的值)的双组分lsm树,并假设我们有一个恒定的速率R(以字节/秒为单位),将新条目插入C0。为简单起见,我们假设之前没有删除条目插入C0组件C1,因此条目必须迁移通过滚动组件C1合并以同样的速度,他们——泽特C0 C0接近阈值的大小尺寸。(考虑到总大小S是近似稳定的,这也意味着对C0的插入率必须与C1的常量删除率平衡,可能使用一系列谓词删除。)当我们改变C0的大小时,就会影响合并游标的循环速度。不断迁移率在字节每秒C1要求滚动游标移动通过合并条目的C0以恒定速率每秒字节,因此C0减少循环率的大小从最小到最大的索引值C0将增加;因此,C1中执行滚动合并的多页块的I/O率也必须增加。如果单个条目的C0大小是可能的,在这个概念上的极端点上,我们需要为每个新插入的条目在C1的所有多页块中循环,这对I/O有巨大的需求。合并C0和C1的方法,而不是像b树那样为每个新插入的条目访问C1的相关节点,将成为我们的负担。相比之下,更大的C0组件将减缓合并游标的循环,并降低插入的I/O成本。然而,这将增加内存驻留组件C0的成本。(有道翻译)

现在,C0有一个标准大小,由LSM树的总成本(C0的内存成本加上C1组件的媒体/磁盘臂成本)最小的点决定。为了达到这一平衡,我们从一个大的C0组件开始,并将C1组件紧密地封装在磁盘介质上。如果C0组件足够大,C1的I/O率将非常小。现在,我们可以减小C0的大小,以昂贵的内存换取廉价的磁盘空间,直到为C1服务的I/O速率增加到某个点,即位于C1组件媒体上的磁盘臂以全速运行。在这一点上,进一步节省内存C0将导致成本增加媒体成本,我们需要分散C1组件在略微满磁盘来减少磁盘臂负载,并在某种程度上我们继续缩小C0将达到一个最低成本点。现在,在两个组件lsm树中,我们为C0确定的规范大小在内存使用方面仍然非常昂贵,这是很常见的。另一种方法是考虑采用由三个或更多组件组成的lsm树。从概念上讲,如果C0组件的大小非常大,内存成本是一个重要因素,那么我们考虑在这两个极端之间创建另一个中等大小的基于磁盘的组件。这将允许我们限制磁盘臂的成本,同时减少C0组件的尺寸。

一般来说,含有K+1个分量的lsm -树有分量C0、C1、C2、…、CK-1和CK,这些分量都是大小递增的索引树结构;C0组件树是内存驻留的,而所有其他组件都是磁盘驻留的(但流行页面与任何磁盘驻留访问树一样都缓冲在内存中)。在插入的压力下,在所有组件对(Ci-1, Ci)之间存在异步滚动合并进程,每当较小的组件Ci-1超过其阈值大小时,就将条目从较小的组件移到较大的组件。在lsm树中插入的长期条目的生命周期中,它从C0树开始,并通过一系列的K个异步滚动合并步骤最终迁移到CK。(有道翻译)

这里的重点是插入流量下的性能,因为我们假设LSM-Tree存在于以插入为主的环境中。lsm树发现三个或更多组件时,性能会有所下降,通常是每个磁盘组件多一个页面I/O。(有道翻译)

todo:自己翻译 仔细看一遍

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,319评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,801评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,567评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,156评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,019评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,090评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,500评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,192评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,474评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,566评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,338评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,212评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,572评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,890评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,169评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,478评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,661评论 2 335