ElasticSearch和springboot的整合和使用

什么是ElasticSearch

Elasticsearch(ES) 是一个基于Lucene构建的开源、分布式、RESTful接口全文搜索引擎。ElasticSearch还是一个分布式文档数据库,其中每个字段均被索引且可被搜索,它能够扩展至数以百计的服务器存储以及处理PB级的数据。他可以在很短的时间内存储、搜索和分析大量的数据。

demo地址 :https://github.com/keyuanupup/springboot-elasticsearch

java与ES整合配置

参考项目现有配置

索引的构建

  1. 索引的创建
  2. 索引的删除
DELETE http://127.0.0.1:9200/goods
  1. 判断索引是否存在

数据操作

  1. 新增数据
POST http://127.0.0.1:9200/goods/_doc/00005
{
    "name":"裤子",
    "skuId":"5",
    "spuId":"2",
    "colorId":"3",
    "price":90.3,
    "colorName":"绿色"
}
  1. 更新数据
POST http://127.0.0.1:9200/goods/_doc/00003/_update
{
    "doc":{
        "price":12.4
    }
}
  1. 删除数据
DELETE http://127.0.0.1:9200/goods/_doc/00002
  1. 根据id查询数据
GET http://127.0.0.1:9200/goods/_doc/00003

搜索

  1. 分页
GET http://127.0.0.1:9200/goods/_doc/_search
{
    "size":2,
    "from":1
}
  1. 排序
GET http://127.0.0.1:9200/goods/_doc/_search
{
    "sort": [
        {
            "skuId": {
                "order": "desc"
            }
        }
    ]
}
  1. term 相等的查询
 GET http://127.0.0.1:9200/goods/_doc/_search
{
  "query": {
    "term": {
      "name.keyword": {
        "value": "袜子"
      }
    }
  }
}
  1. terms in查询
GET http://127.0.0.1:9200/goods/_doc/_search
{
  "query":{
    "terms": {
      "skuId": [
        1,
        2
      ]
    }
  }
}
  1. wildcard 模糊匹配(like)

    text会对字段进行分词处理而keyword则不会

GET http://127.0.0.1:9200/goods/_doc/_search
{
    "query": {
        "wildcard": {
            "name.keyword": {
                "wildcard": "*子牛仔*",
                "boost": 1
            }
        }
    }
}
  1. range 范围查询
 GET http://127.0.0.1:9200/goods/_doc/_search
{
    "query": {
        "range": {
            "skuId": {
                "from": null,
                "to": 2,
                "include_lower": true,
                "include_upper": false,
                "boost": 1
            }
        }
    }
}

  1. match 分词查询
 GET http://127.0.0.1:9200/goods/_doc/_search
{
    "query":{
        "match":{
            "name":"裤子"
        }
    }
}
  1. multi_match 分词查询(匹配多词)
GET http://127.0.0.1:9200/goods/_doc/_search
{
    "query": {
        "multi_match": {
            "query": "红色 裤子",
            "fields": [
                "colorName^1.0",
                "name^1.0"
            ],
            "boost": 1
        }
    },
    "explain":true
}
  1. bool
GET http://127.0.0.1:9200/goods/_doc/_search
{
    "query": {
        "bool": {
            "must": [
                {
                    "term": {
                        "colorId": {
                            "value": 1,
                            "boost": 1
                        }
                    }
                },
                {
                    "wildcard": {
                        "name.keyword": {
                            "wildcard": "*袜子*",
                            "boost": 1
                        }
                    }
                }
            ],
            "adjust_pure_negative": true,
            "boost": 1
        }
    }
}
  1. 查询和过滤
    1. 使用过滤的时候,es不会对条件进行打分,效率会比查询快
  2. 查询指定字段
  3. 折叠
GET http://127.0.0.1:9200/goods/_doc/_search
{
 "collapse": {
    "field": "spuId"
  }
}
1. 折叠后总数统计不准确
  1. 权重
GET http://127.0.0.1:9200/goods/_doc/_search
{
    "query": {
        "bool": {
            "should": [
                {
                    "term": {
                        "skuId": {
                            "value": 5,
                            "boost": 12
                        }
                    }
                },
                {
                    "term": {
                        "colorId": {
                            "value": 1,
                            "boost": 6
                        }
                    }
                }
            ],
            "boost": 1
        }
    },
    "sort": [
        {
            "_score": {
                "order": "desc"
            }
        }
    ],
    "explain":true
}
  1. aggs(分组)

高级

  1. 分片和备份

    cluster:代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的。es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的。

    shards:代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。构成分布式搜索。分片的数量只能在索引创建前指定,并且索引创建后不能更改。

    replicas:代表索引副本,es可以设置多个索引的副本,副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡。

    1. 默认1个分片,一个备份
    2. 加入ik分词器

    ik分词器插件地址 : https://github.com/medcl/elasticsearch-analysis-ik

    使用方法

     - 下载项目
     - mvn package
     - 拷贝elasticsearch-analysis-ik-7.1.0\target\releases\elasticsearch-analysis-ik-7.0.0.zip 到目录 elasticsearch-7.1.0\plugins
     - 重启ES
    
  2. 加入同义词

    同义词插件地址 : https://github.com/bells/elasticsearch-analysis-dynamic-synonym

  3. 重复数据的处理

    1. 对数据给出明确的排序
    2. 传入查询时间,只查询指定时间前的数据
    3. 使用scroll
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356