ElasticSearch支持的基本类型在 2.x -> 5.x 时进行了修改,将 string 类型拆分成 text 和 keyword
本文是基于ES 5.x以上所写
Elasticsearch支持的基本类型
字符串 : text, keyword
text:存储数据的时候,会自动分词,并生成索引
keyword:存储数据的时候,不会分词,而是直接整个词拿去建索引
整数 : byte, short, integer, long
浮点数 : float
布尔型 : boolean
日期 : date
自定义映射
index : 设置此字段能不能被查询,就是决定要不要将这个字段放进倒排索引裡
若index设置为true(默认是true),则表示这个这个字段会被放进倒排索引裡,如果是text就是分词过后放进索引,如果是keyword、integer...就直接整段放进索引裡
若index设置为false,则表示这个字段不放进倒排索引裡,因此不能查询这个字段(因为他不存在于倒排索引裡)
通常这种被设成false的字段,可以想像成是属于一种附属的字段,就是不能被match、term查询,但是当该文档被其他搜索条件搜出来时,他可以附带的一起被找出来,因为他们同属于同一个文档
analyzer : 主要用在text类型的字段上,就是设定要使用哪种分词器来建立索引
可以使用内建的分词器,或是使用自定义的分词器
可以使用/_analyze测试分析器具体会将句子分词成什么样子,它能帮助我们理解Elasticsearch索引内部发生了什么
GET 127.0.0.1:9200/_analyze
{
"analyzer": "standard",
"text": "Text to analyze"
}
具体实例
mapping
PUT 127.0.0.1:9200/mytest
{
"mappings": {
"doc": {
"properties": {
"name": {
"type": "keyword",
"index": false
},
"uid": {
"type": "integer"
},
"nickname": {
"type": "text",
"analyzer": "standard"
}
}
}
}
}
搜索uid时,name会一起被找出来
GET 127.0.0.1:9200/mytest/_search
{
"query": {
"term": {
"uid": 1
}
}
}
{
"uid": 1,
"name": "1-hello",
"nickname": "1-nickname"
}
搜索name,会报error
GET 127.0.0.1:9200/mytest/_search
{
"query": {
"term": {
"name": "1-hello"
}
}
}
"error": {
"type": "illegal_argument_exception",
"reason": "Cannot search on field [name] since it is not indexed."
}
更新映射
当首次创建一个索引的时候,可以指定类型的映射,但假设后来想要增加一个新的映射字段,可以使用/_mapping把新的字段加进mapping映射裡
可以增加一个新的映射,但是不能修改存在的映射,原因是因为这个映射可能有文档去用,如果改了映射的类型,可能会导致索引的数据出错,因此只能新加字段进去,不能修改
具体实例
在mytest映射中的doc类型增加一个新的名爲tag的keyword
PUT 127.0.0.1:9200/mytest/_mapping/doc
{
"properties": {
"tag": {
"type": "keyword",
}
}
}