MySQL使用全文索引(fulltext index)---高性能

2023-12-05 17:20

本文主要是介绍MySQL使用全文索引(fulltext index)---高性能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转载地址:https://blog.csdn.net/u011734144/article/details/52817766/

 

1.创建全文索引(FullText index)

       旧版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的字段上。 

       不过新版的MySQL5.6.24上InnoDB引擎也加入了全文索引,所以具体信息要随时关注官网,

     1.1. 创建表的同时创建全文索引

             CREATE TABLE article ( 
                  id INT AUTO_INCREMENT NOT NULL PRIMARY KEY, 
                  title VARCHAR(200), 
                  body TEXT, 
                  FULLTEXT(title, body) 
              ) TYPE=MYISAM; 
   

    1.2.通过 alter table 的方式来添加

                ALTER TABLE `student` ADD FULLTEXT INDEX ft_stu_name  (`name`) #ft_stu_name是索引名,可以随便起

       或者:ALTER TABLE `student` ADD FULLTEXT ft_stu_name  (`name`)

 

    1.3. 直接通过create index的方式

                CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`)

           也可以在创建索引的时候指定索引的长度:

                CREATE FULLTEXT INDEX ft_email_name ON `student` (`name`(20))

      

2. 删除全文索引

    2.1. 直接使用 drop index(注意:没有 drop fulltext index 这种用法)

                 DROP INDEX full_idx_name ON tommy.girl ;

    2.2. 使用 alter table的方式 

                ALTER TABLE tommy.girl DROP INDEX ft_email_abcd;

 

3.使用全文索引

     跟普通索引稍有不同

     使用全文索引的格式:  MATCH (columnName) AGAINST ('string')

     eg:

           SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪')

           当查询多列数据时:

                建议在此多列数据上创建一个联合的全文索引,否则使用不了索引的。

          SELECT * FROM `student` WHERE MATCH(`name`,`address`) AGAINST('聪 广东')

     3.1. 使用全文索引需要注意的是:(基本单位是词)

            分词,全文索引以词为基础的,MySQL默认的分词是所有非字母和数字的特殊符号都是分词符(外国人嘛)

            这里推荐一篇文章:利用mysql的全文索引实现模糊查询 

       3.2. MySQL中与全文索引相关的几个变量:

             使用命令:mysql> SHOW VARIABLES LIKE 'ft%'; #ft就是FullText的简写

             ft_boolean_syntax    + -><()~*:""&|         #改变IN BOOLEAN MODE的查询字符,不用重新启动MySQL也不用重建索引
             ft_min_word_len    4                                   #最短的索引字符串,默认值为4,(通常改为1)修改后必须重建索引文件

                                                                               重新建立索引命令:repair table tablename quick 

             ft_max_word_len    84                                #最长的索引字符串,默认值为84,修改后必须重建索引文件

             ft_query_expansion_limit   20                      #查询括展时取最相关的几个值用作二次查询

             ft_stopword_file    (built-in)                      #全文索引的过滤词文件,具体可以参考:MySQL全文检索中不进行全文索引默认过滤词         


             特别注意:50%的门坎限制(当查询结果很多,几乎所有记录都有,或者极少的数据,都有可能会返回非所期望的结果)

                       -->可用IN BOOLEAN MODE即可以避开50%的限制。

                      此时使用全文索引的格式就变成了: SELECT * FROM `student` WHERE MATCH(`name`) AGAINST('聪' IN BOOLEAN MODE)

                        更多内容请参考:MySQL中的全文检索(1)

 

4. ft_boolean_syntax (+ -><()~*:""&|)使用的例子:

        4.1  + : 用在词的前面,表示一定要包含该词,并且必须在开始位置。

                            eg: +Apple 匹配:Apple123,     "tommy, Apple"

        4.2  - : 不包含该词,所以不能只用「-yoursql」这样是查不到任何row的,必须搭配其他语法使用。

                            eg: MATCH (girl_name) AGAINST ('-林志玲 +张筱雨')

                              匹配到: 所有不包含林志玲,但包含张筱雨的记录 

        4.3. 空(也就是默认情况),表示可选的,包含该词的顺序较高。 

                       例子:

                 apple banana           找至少包含上面词中的一个的记录行

                 +apple +juice               两个词均在被包含

                 +apple macintosh     包含词 “apple”,但是如果同时包含 “macintosh”,它的排列将更高一些

                 +apple -macintosh   包含 “apple” 但不包含 “macintosh”

        4.4. > :提高该字的相关性,查询的结果会排在比较靠前的位置。 

        4.5.< :降低相关性,查询的结果会排在比较靠后的位置。

                      例子:4.5.1.先不使用 >< 

                                select * from tommy.girl where match(girl_name) against('张欣婷' in boolean mode);

                                   可以看到完全匹配的排的比较靠前

                              4.5.2. 单独使用 >

                                select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴' in boolean mode);

                                  使用了>的李秀琴马上就排到最前面了

 

                             4.5.3. 单独使用 <

                                select * from tommy.girl where match(girl_name) against('张欣婷 <不是人' in boolean mode);

                                 看到没,不是人也排到最前面了,这里使用的可是 < 哦,说好的降低相关性呢,往下看吧。

 

                           4.5.4.同时使用><

                              select * from tommy.girl where match(girl_name) against('张欣婷 >李秀琴 <练习册 <不是人>是个鬼' in boolean mode);

                               到这里终于有答案了,只要使用了 ><的都会往前排,而且>的总是排在<的前面

                        小结一下:1. 只要使用 ><的总比没用的 靠前;

                                       2. 使用  >的一定比 <的排的靠前 (这就符合相关性提高和降低);

                                       3. 使用同一类的,使用的越早,排的越前。

        4.6. ( ):可以通过括号来使用字条件。  

                       eg: +aaa +(>bbb <ccc) // 找到有aaa和bbb和ccc,aaa和bbb,或者aaa和ccc(因为bbb,ccc前面没有+,所以表示可有可无),

                                         然后 aaa&bbb > aaa&bbb&ccc > aaa&ccc

           4.7. ~ :将其相关性由正转负,表示拥有该字会降低相关性,但不像「-」将之排除,只是排在较后面。 

                           eg:   +apple ~macintosh   先匹配apple,但如果同时包含macintosh,就排名会靠后。

           4.8. * :通配符,这个只能接在字符串后面。 

                                 MATCH (girl_name) AGAINST ('+*ABC*')   #错误,不能放前面

                                 MATCH (girl_name) AGAINST ('+张筱雨*')  #正确

           4.9. " " :整体匹配,用双引号将一段句子包起来表示要完全相符,不可拆字。 

                                 eg:  "tommy huang" 可以匹配  tommy huang xxxxx   但是不能匹配  tommy is huang。

5.补充:Windows下无法修改 ft_min_word_len的情况,

          5. 1. 使用cmd打开 services.msc,

                找到你的 MySQL服务,右键Properties,找到你的my.ini所在的路径

                

          5.2. 停止MySQL,在my.ini中增加 ft_min_word_len = 1,重启MySQL,

                    然后使用命令 show variables like 'ft_min_word_len'; 查看是否生效了

转载于:https://www.cnblogs.com/MaxElephant/p/9871132.html

这篇关于MySQL使用全文索引(fulltext index)---高性能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/458439

相关文章

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一