MySQL使用全文索引(fulltext index)

1.创建全文索引(FullText index)

旧版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的字段上。

不过新版的MySQL5.6.24上InnoDB引擎也加入了全文索引,所以具体信息要随时关注官网,

1.1. 创建表的同时创建全文索引

     CREATE TABLE article ( id INT AUTO_INCREMENT NOT NULL PRIMARY KEY, title VARCHAR(200), body TEXT, FULLTEXT(title, body) ) TYPE=MYISAM; 

1.2.通过 alter table 的方式来添加

ALTER TABLE `student` ADD FULLTEXT INDEX ft_stu_name  (`name`)
#ft_stu_name是索引名,可以随便起或者:
ALTER TABLE `student` ADD FULLTEXT ft_stu_name  (`name`)

1.3. 直接通过create index的方式

CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`)#也可以在创建索引的时候指定索引的长度:CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`(20))

2. 删除全文索引

2.1. 直接使用 drop index(注意:没有 drop fulltext index 这种用法)

DROP INDEX full_idx_name ON tommy.girl ;

2.2. 使用 alter table的方式

ALTER TABLE tommy.girl DROP INDEX ft_email_abcd;

3.使用全文索引

跟普通索引稍有不同

使用全文索引的格式:  MATCH (columnName) AGAINST ('string')

eg:

SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪')

当查询多列数据时:

建议在此多列数据上创建一个联合的全文索引,否则使用不了索引的。

 SELECT * FROM `student` WHERE MATCH(`name`,`address`) AGAINST('聪 广东')

3.1. 使用全文索引需要注意的是:(基本单位是词)

分词,全文索引以词为基础的,MySQL默认的分词是所有非字母和数字的特殊符号都是分词符(外国人嘛)

这里推荐一篇文章:利用mysql的全文索引实现模糊查询

3.2. MySQL中与全文索引相关的几个变量:

使用命令:mysql> SHOW VARIABLES LIKE 'ft%'; #ft就是FullText的简写

ft_boolean_syntax    + -><()~*:""&|         #改变IN BOOLEAN MODE的查询字符,不用重新启动MySQL也不用重建索引
             ft_min_word_len    4                                   #最短的索引字符串,默认值为4,(通常改为1)修改后必须重建索引文件

重新建立索引命令:repair table tablename quick 

ft_max_word_len    84                                #最长的索引字符串,默认值为84,修改后必须重建索引文件

ft_query_expansion_limit   20                      #查询括展时取最相关的几个值用作二次查询

ft_stopword_file    (built-in)                      #全文索引的过滤词文件,具体可以参考:MySQL全文检索中不进行全文索引默认过滤词


特别注意:50%的门坎限制(当查询结果很多,几乎所有记录都有,或者极少的数据,都有可能会返回非所期望的结果)

-->可用IN BOOLEAN MODE即可以避开50%的限制。

此时使用全文索引的格式就变成了: SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪' IN BOOLEAN MODE)

更多内容请参考:MySQL中的全文检索(1)

4. ft_boolean_syntax (+ -><()~*:""&|)使用的例子:

4.1  + : 用在词的前面,表示一定要包含该词,并且必须在开始位置。

eg: +Apple 匹配:Apple123,     "tommy, Apple"

4.2  - : 不包含该词,所以不能只用「-yoursql」这样是查不到任何row的,必须搭配其他语法使用。

eg: MATCH (girl_name) AGAINST ('-林志玲 +张筱雨')

匹配到: 所有不包含林志玲,但包含张筱雨的记录

4.3. 空(也就是默认情况),表示可选的,包含该词的顺序较高。

例子:               

 apple banana        找至少包含上面词中的一个的记录行+apple +juice       两个词均在被包含+apple macintosh     包含词 “apple”,但是如果同时包含 “macintosh”,它的排列将更高一些+apple -macintosh    包含 “apple” 但不包含 “macintosh”

4.4. > :提高该字的相关性,查询的结果会排在比较靠前的位置。

4.5.< :降低相关性,查询的结果会排在比较靠后的位置。

例子:4.5.1.先不使用 ><

 select * from tommy.girl where match(girl_name) against('张欣婷' in boolean mode);

                                   

           可以看到完全匹配的排的比较靠前

4.5.2. 单独使用 >

select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴' in boolean mode);

                                  

              使用了>的李秀琴马上就排到最前面了

4.5.3. 单独使用 <

select * from tommy.girl where match(girl_name) against('张欣婷 <不是人' in boolean mode);

                                 

               看到没,不是人也排到最前面了,这里使用的可是 < 哦,说好的降低相关性呢,往下看吧。

4.5.4.同时使用><

select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴 <练习册 <不是人 >是个鬼' in boolean mode);

                               

              到这里终于有答案了,只要使用了 ><的都会往前排,而且>的总是排在<的前面

             小结一下:

                   1. 只要使用 ><的总比没用的 靠前;

                    2. 使用  >的一定比 <的排的靠前 (这就符合相关性提高和降低);

                    3. 使用同一类的,使用的越早,排的越前。

4.6. ( ):可以通过括号来使用字条件。

eg:

+aaa +(>bbb <ccc) // 找到有aaa和bbb和ccc,aaa和bbb,或者aaa和ccc(因为bbb,ccc前面没有+,所以表示可有可无),

然后 aaa&bbb > aaa&bbb&ccc > aaa&ccc

4.7. ~ :将其相关性由正转负,表示拥有该字会降低相关性,但不像「-」将之排除,只是排在较后面。

eg:   +apple ~macintosh   先匹配apple,但如果同时包含macintosh,就排名会靠后。

4.8. * :通配符,这个只能接在字符串后面。

MATCH (girl_name) AGAINST ('+*ABC*')   #错误,不能放前面

MATCH (girl_name) AGAINST ('+张筱雨*')  #正确

4.9. " " :整体匹配,用双引号将一段句子包起来表示要完全相符,不可拆字。

eg:  "tommy huang" 可以匹配  tommy huang xxxxx   但是不能匹配  tommy is huang

5.补充:Windows下无法修改 ft_min_word_len的情况,

5. 1. 使用cmd打开 services.msc,

找到你的 MySQL服务,右键Properties,找到你的my.ini所在的路径

5.2. 停止MySQL,在my.ini中增加 ft_min_word_len = 1,重启MySQL,

然后使用命令 show variables like 'ft_min_word_len'; 查看是否生效了

转自:https://www.cnblogs.com/tommy-huang/p/4483684.html

相关:http://caiceclb.iteye.com/blog/261549

mysql 全文索引fulltext初始相关推荐

  1. mysql fulltext 分词_在mysql中使用全文索引fulltext|mysql,全文索引,fulltext

    全文检索在 MySQL 中就是一个 FULLTEXT 类型索引.FULLTEXT 索引用于   MyISAM 表,可以在 CREATE TABLE 时或之后使用 ALTER TABLE 或 CREAT ...

  2. mysql全文索引FULLTEXT的哈希与BTREE方法对比

    为什么[FULLTEXT]用[BTREE]?答案如下: FULLTEXT: 全文搜索的索引.FULLTEXT 用于搜索很长一篇文章的时候,效果最好.用在比较短的文本,如果就一两行字的,普通的 INDE ...

  3. MySQL全文索引怎么创建

    mysql全文索引 很慢,速度不如like的百分之一 从explain开始说起吧,很显然第一个sql语句压根没用任何索引(key列内什么都没有)!第二个倒是用到索引,却是主键索引,并非你添加的full ...

  4. mysql text index_MySQL 全文索引(fulltext index)

    1.创建全文索引(FullText index) 旧版的MySQL的全文索引只能用在MyISAM表格的char.varchar和text的字段上. 不过新版的MySQL5.6.24上InnoDB引擎也 ...

  5. mysql 某列加全文索引_MySQL使用全文索引(fulltext index)---高性能

    转载地址:https://blog.csdn.net/u011734144/article/details/52817766/ 1.创建全文索引(FullText index) 旧版的MySQL的全文 ...

  6. mysql drop fulltext_MySQL使用全文索引(fulltext index)

    1.创建全文索引(FullText index) 旧版的MySQL的全文索引只能用在MyISAM表格的char.varchar和text的字段上. 不过新版的MySQL5.6.24上InnoDB引擎也 ...

  7. MySQL使用全文索引(fulltext index)

    1.创建全文索引(FullText index) 旧版的MySQL的全文索引只能用在MyISAM表格的char.varchar和text的字段上. 不过新版的MySQL5.6.24上InnoDB引擎也 ...

  8. MySQL使用全文索引(fulltext index) 及中文全文索引使用

    全文索引介绍 1.创建全文索引(FullText index) 旧版的MySQL的全文索引只能用在MyISAM表格的char.varchar和text的字段上. 不过新版的MySQL5.6.24上In ...

  9. mysql fulltext like_MySQL全文索引 FULLTEXT索引和like的区别

    1.概要 InnoDB引擎对FULLTEXT索引的支持是MySQL5.6新引入的特性,之前只有MyISAM引擎支持FULLTEXT索引.对于FULLTEXT索引的内容可以使用MATCH()-AGAIN ...

最新文章

  1. ATS插件开发中内存泄露问题的解决方法探讨
  2. Android短信的发送和广播接收者实现短信的监听
  3. 国2c语言中指针与数组的赋值运算,C语言到汇编-指针与数组2
  4. mysql会话超时机制_mysql超时机制
  5. 即使在jdk中也有错误的代码
  6. 99%的人都不会的用户流失分析,到底应该怎么做?
  7. 连上Internet-linux鸟哥的私房菜服务器篇04(阅读笔记)
  8. eclipse下SVN subclipse插件
  9. Security+ 学习笔记50 取证技术
  10. Kubernetes详解(十七)——Pod存活性探针应用实战
  11. 马什么梅?I什么N?浅谈 web 前端开发中的国际化
  12. 红linux系统,红帽linux系统下载(iso)
  13. 论文阅读-Combining EfficientNet and Vision Transformers for Video Deepfake Detection(深度鉴伪)
  14. cola公司工资java_COLA - 整洁面向对象分层架构
  15. 删除浏览器浏览器删除cookie方法
  16. 基于已知点云地图的NDT的激光SLAM定位
  17. 利用cad等高线生成dem的步骤
  18. 华为实验——两核心两接入一路由配置
  19. 主攻文推荐攻守都有系统_【图片】【推文】一些喜欢的主攻文_主攻文吧_百度贴吧...
  20. 小新计算器用户使用协议

热门文章

  1. CSDN博客访问量突破10万
  2. kafka带kerberos和sasl安全认证:命令行消费指定topic数据
  3. 发现一个vue写的非常有趣的投票和统计工具
  4. Android兼容性优化-Android 8.0设置Activity透明主题崩溃
  5. Rsync 定时同步Windows上的数据
  6. C. Serval and Toxel‘s Arrays
  7. 9.4 Python读取各国GDP数据的json文件并用Pygal绘图
  8. 『零基础学Java语言-浙江大学-翁恺』第6周 使用对象
  9. 中山大学2019年研究生复试机试题目(数据科学与计算机学院)
  10. java语义事件的含义_Java基础之处理事件——应用程序中的语义事件监听器(Sketcher 5 with element color listeners)...