ElasticSearch 分布式全文检索工具(一) 概念介绍

技术背景

对于搜索类需求,传统方式是将数据放入数据库中,然后使用sql语句进行精准查询或模糊查询,但随着业务的发展,数据量逐渐庞大,传统的数据库的性能逐渐不能满足要求,于是很多公司开始对数据库进行读写分离和分库分表,对数据库进行横向和纵向的扩容,但是这种做法增加了数据运维成本,对于大数据量的检索依然很慢,于是就出现了第一款全文检索工具lucene,lucene的缺点是对外暴露的可用接口对于操作来说比较复杂,且效率不高;后来有一款工具基于lucene做了进一步的封装,叫做solr,它是一款高性能分布式检索服务框架,其缺点是在建立索引期间,solr的搜索能力极度下降,造成了不满足实时索引的场景。于是ElasticSearch应运而生,它也是基于lucene开发的,基于restful接口发布,操作便捷

设计目的

  • 为了解决对海量数据进行近实时的处理
  • 提供全文检索,结构化检索,数据分析等功能
  • 实现分布式的搜索引擎和数据分析引擎
  • 用于解决日志的存储、分析、监控的处理

设计思想

  • 分布式
  • 索引库

技术本质

基于内容分词构建索引的工具

核心特性

  1. java 源码: 社区活跃,使用人群多
  2. NRT近实时:高性能,每个字段都有索引
  3. 分布式:高可用,高扩展,高可靠
  4. restful风格:交互简单友好

集群角色

Master

  • 概念:主节点
    通过类似于zk集群的选举机制产生
  • 功能:管理type类的操作,负责所有indices索引库的创建,修改,删除,shard分片的分配地址,维护并更新整个集群的状态

indices

  • 概念:索引库
  • 功能:集中保存索引的地方,一个索引就是一个拥有几份相似特征的Document集合

type

  • 概念:类型
  • 功能: 类型可以理解为索引的逻辑分类/分区,type是逻辑结构,不是物理结构,类似于Hbase的分区字段,查询时可以使用和显示,在6.x版本之前,一个索引库可以有多种类型,6.x版本之后,一个索引库只有一个类型,预计未来会取消

Slaver

  • 概念:从节点

Data Node

  • 概念:数据节点
  • 功能:保存shard分片的数据,可以进行横向扩展

Coordinator Node

  • 概念: 类似于impala-server,哪个data node 接收客户端的请求,哪个data node就会转换为coordinator node,并负责该请求的处理,
  • 功能:接受并处理客户端请求,负责将请求路由到数据shard分片所在的节点上,判断是否需要修改索引库,若有对indices索引库的创建,修改,删除请求,先将请求转发给master

Field

  • 概念:字段,类似于表中的列
  • 解释:

Document

  • 概念: 一个可被索引的基础信息单元,一条完整数据(rdbms中的行数据,hbase中的rowkey+data),
  • 解释:document = documentId + data;其中data可理解为fileds, document在物理上是属于索引库,但是查询是需要指定index/type/documentid;因为type是逻辑存在, documentid类似于rowkey,创建索引库时已经存在,可以自定义,若不自定义,一般会分配20位长度的id,每一条document文档都是以json格式来表示的

Shard

  • 概念:分布式实现的基础,将索引库划分为多个shards分布式存储,就是分区,分片
  • 补充:每个索引库默认有5个shards,document按照分区规则写入对应的shards分片中;分片规则: documentid的hash值对shards个数取余,分片有主从关系,主分片负责对外提供读写,副本分片负责同步主分片的数据和提供轮询下的读请求,primary shard 主分区, replicas shard 副本分区

Replicas

  • 概念: shards分片的备份,副本
  • 解释:默认每个shard分片都会1个replicas副本,相同分片的副本不允许在同一台机器, 轮询策略下replicas分片也可以提供读请求,提高吞吐量
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容