MySQL使用全文索引(fulltext index) 转载

转载地址:https://blog.csdn.net/u011734144/article/details/52817766/

1.创建全文索引(FullText index)

旧版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的字段上。
不过新版的MySQL5.6.24上InnoDB引擎也加入了全文索引,所以具体信息要随时关注官网.

1.1. 创建表的同时创建全文索引

         CREATE TABLE article ( 
              id INT AUTO_INCREMENT NOT NULL PRIMARY KEY, 
              title VARCHAR(200), 
              body TEXT, 
              FULLTEXT(title, body) 
          ) TYPE=MYISAM; 

1.2.通过 alter table 的方式来添加

ALTER TABLE `student` ADD FULLTEXT INDEX ft_stu_name  (`name`)  
ft_stu_name是索引名,可以随便起或者:
ALTER TABLE `student` ADD FULLTEXT ft_stu_name  (`name`)

1.3. 直接通过create index的方式

CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`)
也可以在创建索引的时候指定索引的长度:CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`(20))

2. 删除全文索引

2.1. 直接使用 drop index(注意:没有 drop fulltext index 这种用法)

             DROP INDEX full_idx_name ON tommy.girl ;

2.2. 使用 alter table的方式

            ALTER TABLE tommy.girl DROP INDEX ft_email_abcd;

3.使用全文索引

 跟普通索引稍有不同

 使用全文索引的格式:  MATCH (columnName) AGAINST ('string')

 eg:

       SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪')

       当查询多列数据时:

            建议在此多列数据上创建一个联合的全文索引,否则使用不了索引的。

      SELECT * FROM `student` WHERE MATCH(`name`,`address`) AGAINST('聪 广东')

3.1. 使用全文索引需要注意的是:(基本单位是词)

        分词,全文索引以词为基础的,MySQL默认的分词是所有非字母和数字的特殊符号都是分词符(外国人嘛)

        这里推荐一篇文章:[利用mysql的全文索引实现模糊查询](http://blog.chinaunix.net/uid-24145780-id-125161.html) 

   3.2\. MySQL中与全文索引相关的几个变量:

         使用命令:mysql> SHOW VARIABLES LIKE 'ft%'; #ft就是FullText的简写

         ft_boolean_syntax    + -><()~*:""&|         #改变IN BOOLEAN MODE的查询字符,不用重新启动MySQL也不用重建索引
         ft_min_word_len    4                                   #最短的索引字符串,默认值为4,(通常改为1)修改后必须重建索引文件

                                                                           重新建立索引命令:repair table tablename quick 

         ft_max_word_len    84                                #最长的索引字符串,默认值为84,修改后必须重建索引文件

         ft_query_expansion_limit   20                      #查询括展时取最相关的几个值用作二次查询

         ft_stopword_file    (built-in)                      #全文索引的过滤词文件,具体可以参考:[MySQL全文检索中不进行全文索引默认过滤词](http://ourmysql.com/archives/562)         

         特别注意:50%的门坎限制(当查询结果很多,几乎所有记录都有,或者极少的数据,都有可能会返回非所期望的结果)

                   -->可用IN BOOLEAN MODE即可以避开50%的限制。

                  此时使用全文索引的格式就变成了: SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪' IN BOOLEAN MODE)

                    更多内容请参考:[MySQL中的全文检索(1)](http://blog.csdn.net/navygong/article/details/4185769)

4. ft_boolean_syntax (+ -><()~*:""&|)使用的例子:

4.1 + : 用在词的前面,表示一定要包含该词,并且必须在开始位置。

                        eg: +Apple 匹配:Apple123,     "tommy, Apple"

4.2 - : 不包含该词,所以不能只用「-yoursql」这样是查不到任何row的,必须搭配其他语法使用。

                        eg: MATCH (girl_name) AGAINST ('-林志玲 +张筱雨')

                          匹配到: 所有不包含林志玲,但包含张筱雨的记录 

4.3. 空(也就是默认情况),表示可选的,包含该词的顺序较高。

                   例子:

apple banana找至少包含上面词中的一个的记录行

+apple +juice 两个词均在被包含

+apple macintosh包含词 “apple”,但是如果同时包含 “macintosh”,它的排列将更高一些

+apple -macintosh包含 “apple” 但不包含 “macintosh”

4.4. > :提高该字的相关性,查询的结果会排在比较靠前的位置。

4.5.< :降低相关性,查询的结果会排在比较靠后的位置。

                  例子:4.5.1.先不使用 >< 

                            select * from tommy.girl where match(girl_name) against('张欣婷' in boolean mode);

                            ![image](http://upload-images.jianshu.io/upload_images/3065831-74a069349760251e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

可以看到完全匹配的排的比较靠前

                          4.5.2\. 单独使用 >

                            select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴' in boolean mode);

                            ![image](http://upload-images.jianshu.io/upload_images/3065831-14ff788396ed740f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

使用了>的李秀琴马上就排到最前面了

                         4.5.3\. 单独使用 <

                            select * from tommy.girl where match(girl_name) against('张欣婷 <不是人' in boolean mode);

                            ![image](http://upload-images.jianshu.io/upload_images/3065831-dab13faf3bfc383b.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

看到没,不是人也排到最前面了,这里使用的可是 < 哦,说好的降低相关性呢,往下看吧。

                       4.5.4.同时使用><

                          select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴 <练习册 <不是人>是个鬼' in boolean mode);

                          ![image](http://upload-images.jianshu.io/upload_images/3065831-b57fb9acac5bedca.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

到这里终于有答案了,只要使用了 ><的都会往前排,而且>的总是排在<的前面

                    小结一下:1\. 只要使用 ><的总比没用的 靠前;

                                   2\. 使用  >的一定比 <的排的靠前 (这就符合相关性提高和降低);

                                   3\. 使用同一类的,使用的越早,排的越前。

4.6. ( ):可以通过括号来使用字条件。

                   eg: +aaa +(>bbb <ccc) // 找到有aaa和bbb和ccc,aaa和bbb,或者aaa和ccc(因为bbb,ccc前面没有+,所以表示可有可无),

                                     然后 aaa&bbb > aaa&bbb&ccc > aaa&ccc

4.7. ~ :将其相关性由正转负,表示拥有该字会降低相关性,但不像「-」将之排除,只是排在较后面。

                       eg:   +apple ~macintosh   先匹配apple,但如果同时包含macintosh,就排名会靠后。

4.8. * :通配符,这个只能接在字符串后面。

                             MATCH (girl_name) AGAINST ('+*ABC*')   #错误,不能放前面

                             MATCH (girl_name) AGAINST ('+张筱雨*')  #正确

4.9. " " :整体匹配,用双引号将一段句子包起来表示要完全相符,不可拆字。

                             eg:  "tommy huang" 可以匹配  tommy huang xxxxx   但是不能匹配  tommy is huang。

5.补充:Windows下无法修改 ft_min_word_len的情况,

5. 1. 使用cmd打开 services.msc,

            找到你的 MySQL服务,右键Properties,找到你的my.ini所在的路径

            ![image](http://upload-images.jianshu.io/upload_images/3065831-2418b7b8c9f20c98.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

5.2. 停止MySQL,在my.ini中增加 ft_min_word_len = 1,重启MySQL,

                然后使用命令 show variables like 'ft_min_word_len'; 查看是否生效了
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,651评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,468评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,931评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,218评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,234评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,198评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,084评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,926评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,341评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,563评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,731评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,430评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,036评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,676评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,829评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,743评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,629评论 2 354