一、核心概念
- 节点 节点就是一个ES的进程
- 分片 分片分为主分片与副本分片 主分片负责写入数据 副本分片只负责查询 每个分片本质上都是一个lettue
- 索引 可以简单的理解为mysql中的数据库(database的概念) 当然两者并不完全等同 默认创建的索引只包含一个主分片 副本分片可以灵活的扩展 但是主分片的数量只能在创建索引的时候指定 一旦指定不可更改
- 类型 可以理解为数据库中的表 ES后面会废弃掉这个概念 现在默认创建索引的type为_doc
- 文档 可以理解为关系型数据库中的一行记录 需要注意的是ES执行删除操作的时候 并不会立即清除 只是标记清除某个文档
- Mapping Mapping是定义文档及其包含字段的存储和索引方式的过程 可以简单理解为关系型数据库中的表结构的定义
二 ES的常用命令
-
索引操作
#创建一个默认配置的索引 PUT /indexName?pretty 下面创建了一个名为index_test的索引 PUT /index_test?pretty #删除一个索引 DELETE /indexName?pretty DELETE /index_test?pretty #查看某个索引的详细信息 GET /indexName/_search 等价与select * from xx GET /index_test/_search #查询某个索引的详细信息 与GET /index_test/_search完全等价 GET /index_test/_search { "query":{ "match_all":{} } } #查看ES索引列表的详细信息 GET _cat/indices?v GET _cat/indices?v
-
查询某个索引的信息
-
查询ES索引列表的信息
-
文档操作
#插入数据 PUT /index_name/type_name/id 换行接入json格式数据 其中type_name 固定为_doc即可 因为type并没有意义 #全量更新 与 插入数据一模一样 文档id一样直接put会对原来的数据进行覆盖 即达到修改的效果 此时文档的version会增加 PUT /index_test/_doc/1 { "product_name":"xiaomi", "desc":"小米手机", "price":4999, "tags":["xingjiabi","fashao","gongjiaoka"] } #增量更新的内容都要写在doc字段下 增量更新文档有两种方式 #第一种 POST /index_name/type_name/id/_update 换行 接入需要更新的字段 此时不会覆盖原有的字段 #下面表示增量更新文档id为2的文档 并设置其desc字段的值为华为P30 POST /index_test/_doc/2/_update { "doc":{ "desc":"华为P30" } } #增量更新第二种方式 POST /index_name/_update/id #下面表示增量更新文档id为2的文档 并设置其desc字段的值为华为P40 POST /index_test/_update/2 { "doc":{ "desc":"华为P40" } } #查询某个文档 GET /index_name/type_name/id GET /index_test/_doc/2 #删除文档 DELETE /index_name/type_name/id DELETE /index_test/_doc/1
-
插入/全量更新某个文档
-
查询某个文档
-
增量更新
三 Mapping映射
Mapping有两种方式 1、动态映射 也叫自动映射 2、手工映射也叫静态映射
ES数据类型
- 数字类型 包括long、integer、short、byte、double、float、half_float、scaled_float、unsigned_long
- keyword keyword类型适用于索引结构化字段 可以用于过滤、排序、聚合 keyword字段只支持精确匹配 keyword是不会被分词的 建议文档id用keyword类型 而不用Integer类型 这样效率更高
- text text支持分词和模糊匹配 不能用具聚合、排序等 并且text字段的内容 不会创建doc_values(也就是正排索引)
- Date 日期类型
- 布尔类型
- nested 嵌套类型 对应List或者是数组类型的数据
- 二进制类型
- 范围类型 也就是range
- 数组类型 也就是array
- 对象类型 也就是object
- geo 类似于redis的geo 表示经纬度的
Mapping操作
#查看某个索引的mapping GET /index_name/_mapping
GET /index_test/_mapping
#设置mapping(手工添加映射) PUT /index_name 换行接 json 示例如下 其中mappings、properties、2个属性是固定不变的 fieldName表示你要设置字段的名称 设置mapping的时候除了type属性外还有其他的属性
PUT /index_test
{
"mappings": {
"properties": {
"name":{
"type":"keyword"
},
"age":{
"type":"integer" #需要注意在设置mapping的时候type属性一旦指定 是不允许被修改的
}
}
}
}
Mapping的参数
设置mapping的时候除了上面示例的type属性外还有其他的属性 我们一般在手动设置mapping时只会设置type和analyzer
mapping属性 | 含义 |
---|---|
index | 表示是否对当前字段创建倒排索引 默认为true 如果不创建索引 该字段不会被索引搜索到 但仍会在source元素中显示 |
analyzer | 表示为当前字段指定分词器(standard, ik分词器等) 这个属性只能是type是text类型的时候才能设置 如果是数字类型、keyword是不支持的 |
boost | 对当前字段相关度的评分权重 默认为1 |
coerce | 是否允许强制类型转换 |
copy_to | 该参数允许将多个字段的值复制到数组中,然后可以将其作为单个字段进行查询 |
doc_values | 默认为true 也就是正向索引 可以提高排序和聚合的效率 不支持text |
enable | 是否创建倒排索引 这是一个全局属性 不用指定字段的 而index只能放在某个filed下 |
ignore_above | 超过长度将会被忽略 类似于百度搜索框搜索条件过长时 会自动截取一定长度作为搜索条件 |
norms | 是否禁用评分 在filter和聚合字段上应该禁用 |
search_analyzer | 单独为查询的时候设置分词器 |
store | 该字段是否仅查询 |
-
查看mapping
-
设置mapping
-
设置mapping 注意index 和 enable位置的区别 以及analyzer设置的位置