Elasticsearch原理解析--searchable snapshots

介绍

ES在7.10版本引入了searchable snapshots特性。这里我体验了下searchable snapshots特性,并窥探了内部原理。

es snapshots功能,可以将线上集群的数据备份到一些类似OSS、S3、HDFS等廉价的存储上,如果要使用备份的数据,需要通过restore接口将数据load到在线集群使用。

es主要存储的时序的数据,历史数据一般查询较少。如果跟热数据放在一起,成本消耗很大。所以es一般先使用冷热架构,一个集群中分为hot和warm两种机型,定时把历史数据从hot节点迁移到warm节点。warm节点还需要占用节点cpu、内存资源,而且一般还要有副本保证数据不丢,所以再冷一点的数据,就会做snapshot备份起来,然后在集群中删除数据。

snapshot需要查询时,只能手动restore到在线集群,查询完成后再手动删除。

对于正常索引,节点上的shard是如下图所示:

image.png

而使用searchable snapshots后,节点上的shard会是如下图所示:

image.png

这样,节点上只用存储主shard,而不再需要副本,节点离线后,snapshots会从其他节点自动恢复。

使用方式

使用searchable snapshot的方式的使用很简单,通过mount命令将snapshot中的索引挂载到线上集群的一个索引中,这样就能通过search接口访问snapshot索引的数据。

具体命令见:https://www.elastic.co/guide/en/elasticsearch/reference/master/searchable-snapshots-api-mount-snapshot.html

挂载的示例如下:

POST /_snapshot/my_repository/my_snapshot/_mount?wait_for_completion=true
{
  "index": "my_docs", 
  "renamed_index": "docs", 
  "index_settings": { 
    "index.number_of_replicas": 0
  },
  "ignored_index_settings": [ "index.refresh_interval" ] 
}

接下来就可以像正常索引一样使用。

原理

加载原理

mount接口主要的流程就是调用restoreSnapshot接口,跟正常restore不一样的地方主要体现在传入的参数上。

其中最主要的参数是如下参数:

"index.allocation.existing_shards_allocator" : "searchable_snapshot_allocator"

这是为了支持searchable snapshot增加的功能。主要解决的就是挂载snapshot节点离线后,上面的shard可以自动重新分配到其他节点上。

以前es对于没有replica的索引,是不支持主shard离线后,自动分配shard到其他节点,因为这样就意味着数据丢失。但是searchable snapshot可以做到主shard离线后,在其他节点重新restore该shard的数据,所以增加了existing_shards_allocator功能。

    private void reroute(RoutingAllocation allocation) {
        assert hasDeadNodes(allocation) == false : "dead nodes should be explicitly cleaned up. See disassociateDeadNodes";
        assert AutoExpandReplicas.getAutoExpandReplicaChanges(allocation.metadata(), allocation).isEmpty() :
            "auto-expand replicas out of sync with number of nodes in the cluster";
        assert assertInitialized();

        removeDelayMarkers(allocation);

        //增加如下方法,处理节点离线导致的未分配的shard(将gatewayAllocator.allocateUnassigned合并入该方法)
        allocateExistingUnassignedShards(allocation);  // try to allocate existing shard copies first
        shardsAllocator.allocate(allocation);
        assert RoutingNodes.assertShardStats(allocation.routingNodes());
    }

searchable snapshot会默认添加searchable_snapshot_allocator,该allocator在处理unassigned shard时,会将shard的recovery方式改成从snapshot恢复,这样该shard的状态就跟调用restore snapshot时一样。

之后的流程就是复用原来的逻辑,balance模块寻找合适的节点分配该shard,然后走recover from snapshot。

public class SearchableSnapshotAllocator implements ExistingShardsAllocator {

    public static final String ALLOCATOR_NAME = "searchable_snapshot_allocator";
......

    @Override
    public void allocateUnassigned(
        ShardRouting shardRouting,
        RoutingAllocation allocation,
        UnassignedAllocationHandler unassignedAllocationHandler
    ) {
        if (shardRouting.primary()
            && (shardRouting.recoverySource().getType() == RecoverySource.Type.EXISTING_STORE
                || shardRouting.recoverySource().getType() == RecoverySource.Type.EMPTY_STORE)) {
            // we always force snapshot recovery source to use the snapshot-based recovery process on the node
......
            shardRouting = unassignedAllocationHandler.updateUnassigned(
                shardRouting.unassignedInfo(),
                new RecoverySource.SnapshotRecoverySource(
                    RecoverySource.SnapshotRecoverySource.NO_API_RESTORE_UUID,
                    snapshot,
                    Version.CURRENT,
                    indexId
                ),
                allocation.changes()
            );
        }    

        final AllocateUnassignedDecision allocateUnassignedDecision = decideAllocation(allocation, shardRouting);

        if (allocateUnassignedDecision.isDecisionTaken() && allocateUnassignedDecision.getAllocationDecision() != AllocationDecision.YES) {
            unassignedAllocationHandler.removeAndIgnore(allocateUnassignedDecision.getAllocationStatus(), allocation.changes());
        }
    }
}

读snapshot原理

index.store.type设置为snapshot,这样会去加载SearchableSnapshotDirectory。

SearchableSnapshotDirectory实现了Directory的方法,其中跟写相关的接口都是直接返unsupportedException。

更多细节

es在文档中只列出了mount接口,在介绍文章中也只是说到了只用加载一个副本,以达到50%的成本节约。但是在查看es源码时,里面还有更多的细节。

searchable snapshots还支持stats接口和clear cache接口。

stats接口是获取一些searchable snapshots索引的指标信息。

从clear cache接口中,发现了searchable snapshots可以支持更加强大的功能。

调用clear cache接口,可以清楚snapshot索引在节点上的数据,在下次search再动态从snapshot中加载。

searchable snapshots最终应该是期望做成snapshot数据不一定要一直停留在节点上,可以支持按需加载与LRU。现在clear cache接口可以直接清掉节点上的shard数据,然后在search索引时,再动态加载数据。

这个特性从这个功能从issue上的名称“Lazy snapshot restores”可以看出来,他们是想做延迟加载snapshot,最后取名为“searchable snapshots”

资料

https://www.elastic.co/cn/blog/introducing-elasticsearch-searchable-snapshots

https://github.com/elastic/elasticsearch/issues/50999

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容