Database internals - indexes

Secondary indexes用来过滤非primary key列的表查询。例如,一个表存储cyclist names 和ages。使用cyclist的last name作为主键,可能会有一个age字段的secondary index,使得能够允许根据年龄来查询。查询匹配非主键的列是反范式的,因为这样的查询需要从表中读取连续的数据片段。


如果一个表根据last names来存储数据,表将会分成多个parittions存储在不同的节点上。基于last names的某个特定范围的查询,比如所有的last name 为Matthews的cyclists,会从表中获取连续的rows,但是基于age的查询,比如哪些cyclists 28岁,会查询所有的节点。非primary keys的列在数据存储时是乱序的。这种根据非主键的查询会导致全partitions的扫描。扫描所有的partitions会导致非常高昂的读延迟,因此这是不好的。

可以为表的某一个列构建Secondary indexes。这些indexes是通过node上的后台进程构建出来的,这些indexes存储在每个节点本地的一个隐藏表中。如果在一个query中使用了一个secondary index,但没有指定partition key,这样的query同样会有高延迟,因为所有的节点都得查询(二级索引是在每个节点上单独生成的,存放了这个节点上,该列的index,因此如果查询时不指定partition key,还是要所有节点扫一遍)。若要想在查询的时候指定partition key 或者secondary index等参数,需要将Cassadra的查询选项置为 ALLOW FILTERING。这个选项不适用生产环境???。如果一个查询包括一个partiton key的条件和secondary index列条件,那这个查询的效率会很高,因为该查询会直接定位到a single node partition(上面去找)。

然而上面提到的方法并不能保证使用索引会效率很高,因此需要知道when and when not to use an index。以cyclists为例,可以使用age列上的index,但是更好的解决方案是创建一个materialized view或者新建一张以age为主键的表。

和关系型数据库一样,维护index需要时间和资源,因此要避免不必要的indexes。当一个列被更新的时候,它的index也需要更新。如果不断的更新某一行,那么memtable中可能会有该行过时的列值,Cassandra会将对应的过时的index entry删除;然后在compaction的时候,该index entry会被彻底清除。如果读操作在compaction之前看到了一个过时的index entry,reader线程会将它置为无效。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351