SQL Server 2000 全文检索

2024-03-01 04:38

本文主要是介绍SQL Server 2000 全文检索,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用 CONTAINSTABLE 和 FREETEXTTABLE 赋值行集函数

CONTAINSTABLE 和 FREETEXTTABLE 函数用来指定返回每行的相对排名的全文查询。这两个函数与全文谓词 CONTAINS 和 FREETEXT 很相似,但是用法不同。

区分全文谓词与函数

虽然全文谓词和全文赋值行集函数都用于全文查询,而且二者用来指定全文检索条件的 Transact-SQL 语句是一样的,但是它们在使用方法上仍有主要差别:

  • CONTAINS 和 FREETEXT 都返回 TRUE 或 FALSE 值,因此它们一般在 SELECT 语句的 WHERE 子句中指定。

    CONTAINSTABLE 和 FREETEXTTABLE 都返回一个有 0、1 或多行的表,因此它们必须总是在 FROM 子句中指定。

  • CONTAINS 和 FREETEXT 只能用于指定选择条件,Microsoft® SQL Server™ 使用该条件确定结果集的成员资格。

    CONTAINSTABLE 和 FREETEXTTABLE 也用来指定选择标准。返回的表中有一个名为 KEY的列,其中包含全文键值。每个全文注册表均含有这样的列,该列中的值一定是唯一的。在 CONTAINSTABLE 或 FREETEXTTABLE 返回的全文注册表中,KEY 列中的值是匹配全文检索条件中所指定的选择条件的行的唯一值。

    不仅如此,CONTAINSTABLE 和 FREETEXTTABLE 产生的表中还有名为 RANK 的一列,其中包含从 0 到 1000 的值。这些值用来根据返回的行满足选择标准的程度对它们进行排序。

使用 CONTAINSTABLE 和 FREETEXTTABLE 函数的查询比那些使用 CONTAINS 和 FREETEXT 谓词的查询更复杂,因为函数返回的符合要求的行必须显式地与原始 SQL Server 表中的行联接起来。

对于包含位于词"sauces"或"candies"附近的"sweet and savory"的 Description 列,下面的示例返回其所有食品分类的描述和分类名称。所有具有"Seafood"分类名称的行都将被忽视。仅返回等级值为 2 或等级值更高的行。

USE Northwind
GO
SELECT FT_TBL.Description,
FT_TBL.CategoryName,
KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)'
) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK > 2
AND FT_TBL.CategoryName <> 'Seafood'
ORDER BY KEY_TBL.RANK DESC

对于包含位于词"sauces"或"candies"附近的"sweet and savory"的 Description 列,下面的示例返回其前 10 种食品的描述和分类名称。

SELECT FT_TBL.Description, 
FT_TBL.CategoryName,
KEY_TBL.RANK
FROM Categories AS FT_TBL INNER JOIN
CONTAINSTABLE (Categories, Description,
'("sweet and savory" NEAR sauces) OR
("sweet and savory" NEAR candies)'
, 10
) AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
CONTAINSTABLE 和 CONTAINS 之间的比较

CONTAINSTABLE 函数和 CONTAINS 谓词使用相似的检索条件。

但是,在 CONTAINSTABLE 中指定将进行全文检索的表、要在表中检索的某列(或所有列)以及检索条件。还有一个参数是可选参数,使用户可以指出只返回最大指定数目的匹配项。有关更多信息,请参见"限制结果集"部分。

CONTAINSTABLE 返回包含一个名为 RANK 的列的表。这个 RANK 列包含表示行与选择条件匹配程度的每行的值。

此查询使用 CONTAINSTABLE 指定返回每行的排名值。

USE Northwind
GO
SELECT K.RANK, CompanyName, ContactName, Address
FROM Customers AS C
INNER JOIN
CONTAINSTABLE(Customers,Address, 'ISABOUT ("des*",
Rue WEIGHT(0.5),
Bouchers WEIGHT(0.9)
)
'
) AS K
ON C.CustomerID = K.[KEY]

下面是结果集:

RANK CompanyName          ContactName       address            
---- ------------ ----------- -------
123 Bon app' Laurence Lebihan 12, rue des Bouchers
65 Du monde entier Janine Labrune 67, rue des Cinquante Otages
15 France restauration Carine Schmitt 54, rue Royale
15 La maison d'Asie Annette Roulet 1 rue Alsace-Lorraine
15 Maison Dewey Catherine Dewey Rue Joseph-Bens 532
15 M
ère Paillarde Jean Fresnière 43 rue St. Laurent
15 Sp
écialités du monde Dominique Perrier 25, rue Lauriston
15 Vins et alcools Paul Henriot 59 rue de l'Abbaye
Chevalier
15 Victuailles en stock Mary Saveley 2, rue du Commerce
FREETEXTTABLE 和 FREETEXT 之间的比较

下面的查询将 FREETEXTTABLE 查询扩展为先返回排名最高的行,并将每行的等级加到选择列表中。要指定该查询,必须知道 CategoryIDCategories 表的唯一键列。

USE Northwind
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Categories AS FT_TBL
INNER JOIN
FREETEXTTABLE(Categories, Description,
'How can I make my own beers and ales?') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
ORDER BY KEY_TBL.RANK DESC
GO

FREETEXTTABLE 与 FREETEXT 在语法上的唯一区别是插入表名作为第一个参数。

下面是同一个查询的扩充,此查询只返回排名值为 10 或更大的行:

USE Northwind
GO
SELECT KEY_TBL.RANK, FT_TBL.Description
FROM Categories FT_TBL
INNER JOIN
FREETEXTTABLE (Categories, Description,
'How can I make my own beers and ales?') AS KEY_TBL
ON FT_TBL.CategoryID = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
GO
标识唯一键列名

使用赋值行集函数的查询很复杂,因为必须知道唯一键列的名称。每个启用全文查询的表都有 TableFulltextKeyColumn 属性,其中包含为在该表实施唯一行而选择的列的 ID 号。此例显示了如何以编程方式获得和使用键列名。

USE Northwind
GO
DECLARE @key_column sysname
SET @key_column = Col_Name(Object_Id('Categories'),
ObjectProperty(Object_id('Categories'),
'TableFulltextKeyColumn')
)
print @key_column
EXECUTE ('SELECT Description, KEY_TBL.RANK
FROM Categories FT_TBL
INNER JOIN
FreetextTable (Categories, Description,
''How can I make my own beers and ales?'') AS KEY_TBL
ON FT_TBL.'
+
@key_column
+
' = KEY_TBL.[KEY]
WHERE KEY_TBL.RANK >= 10
ORDER BY KEY_TBL.RANK DESC
')
GO

可以编写接受关于查询的一些事实的存储过程,以避免使用 CONTAINSTABLE 和 FREETEXTTABLE 的复杂性,然后可以创建并执行相应的查询。下面是一个简化的过程,它提交一个 FREETEXTTABLE 查询。下表显示了过程参数(所有输入)。

参数必需描述
@additional_predicates可选如果有的话,用 AND 加在 FREETEXT 谓词后面。KEY_TBL.RANK 可以用于表达式内部。
@freetext_column 
@freetext_search检索条件。
@from_table 
@order_by_list可选KEY_TBL.RANK 可以是指定的列之一。
< select_list >KEY_TBL.RANK 可以是指定的列之一。

该过程的代码如下:

CREATE PROCEDURE freetext_rank_proc
@select_list nvarchar(1000),
@from_table nvarchar(517),
@freetext_column sysname,
@freetext_search nvarchar(1000),
@additional_predicates nvarchar(500) = '',
@order_by_list nvarchar(500) = ''
AS
BEGIN
DECLARE @table_id integer,
@unique_key_col_name sysname,
@add_pred_var nvarchar(510),
@order_by_var nvarchar(510)

-- Get the name of the unique key column for this table.
SET @table_id = Object_Id(@from_table)
SET @unique_key_col_name =
Col_Name( @table_id,
ObjectProperty(@table_id, 'TableFullTextKeyColumn') )

-- If there is an additional_predicate, put AND() around it.
IF @additional_predicates <> ''
SET @add_pred_var = 'AND (' + @additional_predicates + ')'
ELSE
SET @add_pred_var = ''

-- Insert ORDER BY, if needed.
IF @order_by_list <> ''
SET @order_by_var = 'ORDER BY ' + @order_by_var
ELSE
SET @order_by_var = ''

-- Execute the SELECT statement.
EXECUTE ( 'SELECT '
+ @select_list
+ ' FROM '
+ @from_table
+ ' AS FT_TBL, FreetextTable('
+ @from_table
+ ','
+ @freetext_column
+ ','''
+ @freetext_search
+ ''') AS KEY_TBL '
+ 'WHERE FT_TBL.'
+ @unique_key_col_name
+ ' = KEY_TBL.[KEY] '
+ @add_pred_var
+ ' '
+ @order_by_var
)
END

此过程可以用来提交该查询:

USE Northwind
GO
EXECUTE freetext_rank_proc
'Description, KEY_TBL.RANK', -- Select list
'Categories', -- From
'Description', -- Column
'How can I make my own beers and ales?', -- Freetext search
'KEY_TBL.RANK >= 10', -- Additional predicate
'KEY_TBL.RANK DESC' -- Order by
GO
限制结果集

在许多全文查询中,符合检索条件的项有很多。为了防止查询返回太多的匹配值,可以在 CONTAINSTABLE 和 FREETEXTTABLE 中使用可选参数 top_n_by_rank,根据想返回的排名指定匹配数量。

有了这些信息,Microsoft® SQL Server™ 将按等级值对匹配项进行排序,然后只返回达到指定数目的匹配项。这种选择可以大幅度提高性能。例如,对于正常情况下会从一个一百万行的表中返回 100,000 行的查询而言,如果只要求返回前 100 行,则查询处理速度将会更快。

如果在前面使用 CONTAINSTABLE 的示例中,只想返回前 3 个匹配项,则查询形式如下:

USE   Northwind
GO
SELECT K.RANK, CompanyName, ContactName, Address
FROM Customers AS C
INNER JOIN
CONTAINSTABLE(Customers,Address, 'ISABOUT ("des*",
Rue WEIGHT(0.5),
Bouchers WEIGHT(0.9))', 3) AS K
ON C.CustomerID = K.[KEY]

下面是结果集:

RANK CompanyName          ContactName       address            
---- ------------ ----------- -------
123 Bon app' Laurence Lebihan 12, rue des Bouchers
65 Du monde entier Janine Labrune 67, rue des Cinquante Otages
15 France restauration Carine Schmitt 54, rue Royale

这篇关于SQL Server 2000 全文检索的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/761247

相关文章

MySQL MCP 服务器安装配置最佳实践

《MySQLMCP服务器安装配置最佳实践》本文介绍MySQLMCP服务器的安装配置方法,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下... 目录mysql MCP 服务器安装配置指南简介功能特点安装方法数据库配置使用MCP Inspector进行调试开发指

mysql中insert into的基本用法和一些示例

《mysql中insertinto的基本用法和一些示例》INSERTINTO用于向MySQL表插入新行,支持单行/多行及部分列插入,下面给大家介绍mysql中insertinto的基本用法和一些示例... 目录基本语法插入单行数据插入多行数据插入部分列的数据插入默认值注意事项在mysql中,INSERT I

一文详解MySQL如何设置自动备份任务

《一文详解MySQL如何设置自动备份任务》设置自动备份任务可以确保你的数据库定期备份,防止数据丢失,下面我们就来详细介绍一下如何使用Bash脚本和Cron任务在Linux系统上设置MySQL数据库的自... 目录1. 编写备份脚本1.1 创建并编辑备份脚本1.2 给予脚本执行权限2. 设置 Cron 任务2

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

MySQL 衍生表(Derived Tables)的使用

《MySQL衍生表(DerivedTables)的使用》本文主要介绍了MySQL衍生表(DerivedTables)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录一、衍生表简介1.1 衍生表基本用法1.2 自定义列名1.3 衍生表的局限在SQL的查询语句select

MySQL 横向衍生表(Lateral Derived Tables)的实现

《MySQL横向衍生表(LateralDerivedTables)的实现》横向衍生表适用于在需要通过子查询获取中间结果集的场景,相对于普通衍生表,横向衍生表可以引用在其之前出现过的表名,本文就来... 目录一、横向衍生表用法示例1.1 用法示例1.2 使用建议前面我们介绍过mysql中的衍生表(From子句