MySQL全文索引（docker）

特点

Mysql 5.6之前版本，只有myisam支持全文索引，5.6之后，Innodb和myisam均支持全文索引
ngram全文解析器，用来支持中文、日文、韩文分词
只有char、varchar、text类型字段能创建全文索引
英文分词用空格，逗号；中文分词用 ngram_token_size 设定

创建全文索引

创建表的时候创建

CREATE TABLE articles (
    id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
    title VARCHAR (200),
    body TEXT,
    FULLTEXT (title, body) WITH PARSER ngram
) ENGINE = INNODB DEFAULT CHARSET=utf8mb4 COMMENT='文章表';

创建表之后创建

ALTER TABLE articles ADD FULLTEXT INDEX title_body_index (title,body) WITH PARSER ngram;

查询

不指定模式，默认使用自然语言模式

SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('文言文');

指定模式

SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('文言文' IN NATURAL LANGUAGE MODE);
SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('文言文' IN BOOLEAN MODE);

问题

查询数据不完整?如数据中明明存在文言文, 但是查询 文言的时候查询不到

解决方案

使用 boolean mode通配符模式。如有单词calculate, 查询匹配为select * from articles where match(title,body) AGAINST('cal*' in boolean mode);即可，如果用普通的自然语言模式+通配符则查询不到
调整 ngram_token_size的大小至合适的长度

查询模式

ngram Parser Term Search

模式查询
- 在NATURAL LANGUAGE MODE检索模式下，查询关键字表达式被转换为若干个ngram词语的联合
  - 字符串“管理开发”（假设ngram_token_size=2）会被转换为“管理理开开发”。给出多行记录，这多条记录都匹配检索词语“管理理开开发”，只要包含其中之一即可，匹配其一即可返回
- 在BOOLEAN MODE检索模式下，查询关键字表达式被转换为一个ngram短语检索
  - 例如，字符串“项目中管理”（假设ngram_token_size=2）会被转换为“项目目中中管管理”。给出多行记录，这多条记录都匹配检索词语“项目目中中管管理”。但是只有包含 “项目中管理” 的记录行匹配检索短语 ‘“项目目中中管管理”’，完全匹配才可返回

ngram Parser Wildcard Search

通配符查询
- 如果查询的通配符长度小于ngram token size
  - 如果查询的通配符长度小于ngram token size, 查询返回所有索引的行，这些行包含以前缀术语开头的ngram token
- 如果查询的通配符长度大于ngram token size
  - 该前缀词语会被转换为一个ngram短语，与此同时，通配符符号会被忽略。例如，假设ngram_token_size=2，“管理开发 *”通配符检索会被转换为“管理开发”（“ngram Parser Term Search”的BOOLEAN MODE）

ngram Parser Phrase Search

短语查询
- 例如，检索短语“abc”会被转换为“ab bc”，包含“abc”和“ab bc”的记录都会被返回。检索短语“abc def”会被转换为“ab bc de ef”，包含“abcdef”的记录不会被返回

参考：
https://blog.csdn.net/u013887008/article/details/106757993
https://zhuanlan.zhihu.com/p/88275060

MySQL全文索引（docker）

MySQL全文索引（docker）

特点

创建全文索引

查询

相关参数

问题

解决方案

查询模式

推荐阅读更多精彩内容