什么是分词?
把文本转换为一个个的分词,分词称之为analysis。es默认只对英文做分词,中文不支持,中文会被拆为单独的个体。
es内置分词器
- standard: 默认分词,单词会被拆分。大写会被转换为小写。
- simple: 按照非字母分词。大写会被转换为小写。
- whitespace: 按照空格分词。忽略大小写。
- stop: 去除无意义单词,比如the/is/an...
- keyword: 不做分词。把整个文本作为单独的关键字。
把文本转换为一个个的分词,分词称之为analysis。es默认只对英文做分词,中文不支持,中文会被拆为单独的个体。