SQL Server FullText解决Like字句性能问题

本文涉及的产品
云数据库 RDS SQL Server,独享型 2核4GB
简介: # 场景引入 这天老鸟火急火燎的冲到菜鸟座位:“还记得你在云栖社区发表的一篇名为‘SQL Server利用HashKey计算列解决宽字段查询的性能问题’的文章吗?被人踢馆啦,人家觉得你这个限制条件太苛刻,只能解决完全等于的问题条件下的性能问题,没有太大的现实意义。” 菜鸟烧脑的调动大脑的每一个细胞:“哦,你说的是这篇文章啊?”。 [SQL Server利用HashKey计算列解决宽字段查

场景引入

这天老鸟火急火燎的冲到菜鸟座位:“还记得你在云栖社区发表的一篇名为‘SQL Server利用HashKey计算列解决宽字段查询的性能问题’的文章吗?被人踢馆啦,人家觉得你这个限制条件太苛刻,只能解决完全等于的问题条件下的性能问题,没有太大的现实意义。”
菜鸟烧脑的调动大脑的每一个细胞:“哦,你说的是这篇文章啊?”。

SQL Server利用HashKey计算列解决宽字段查询的性能问题

问题分析

菜鸟反思着,的确,需要完全匹配这个条件限制太严格了,SQL Server有没有一种方法来代替LIKE字句的功能而又可以大大提高查询效率的呢?因为,我们知道,LIKE左模糊匹配是可以使用到索引,而右模糊和完全模糊匹配是完全无法使用到索引的。G哥告诉菜鸟有解决方法,用FullText搜索啊。据说阿里云RDS SQL Server 2008和ECS 版RDS SQL 2012都支持SQL Server的FullText哦,对于使用阿里云RDS SQL Server的用户真是个好消息。

解决方法

来看我们的一个简单测试。

创建测试对象

USE master
GO
IF DB_ID('test') IS NULL
    CREATE DATABASE Test;
GO

use test
go

--in order to check fulltext enable or not.
SELECT is_fulltext_enabled,*
FROM sys.databases
WHERE name = DB_NAME()
;

IF OBJECT_ID('dbo.Item','u') IS NOT NULL
BEGIN
    TRUNCATE TABLE dbo.Item
    DROP TABLE dbo.Item
END
GO

CREATE TABLE dbo.Item
(
id int identity(1,1) primary key
,item_number int not null
,item_desc varchar(4000) null
);
GO

--fulltext unique index creating
CREATE UNIQUE INDEX uix_item_number ON dbo.Item(item_number);

--fulltext catelog creating
IF NOT EXISTS(
        SELECT * FROM sys.fulltext_catalogs WITH(NOLOCK)
        WHERE name = N'ftxt_Item')
BEGIN
    CREATE FULLTEXT CATALOG ftxt_Item AS DEFAULT;
END;

--create fulltext index 
CREATE FULLTEXT INDEX ON dbo.Item(item_desc) 
KEY INDEX uix_item_number 
ON ftxt_Item;
GO

初始化数据

--testing table data init.
DECLARE
    @do int
    ,@loop int
    ,@item_desc varchar(4000)
;

SELECT
    @do = 1
    ,@loop = 100000
    ,@item_desc = ''
;

SET NOCOUNT ON
WHILE @do <= @loop
BEGIN
    set 
        @item_desc = REPLICATE(newid(),112)
    ;
    INSERT INTO dbo.Item
    SELECT CHECKSUM(@item_desc),@item_desc;

    SET @do = @do + 1;
END;
GO

创建索引失败

想要在超过900byte宽度的字段上创建索引,门都没有,SQL Server直接报错。

--try to create index on item_desc:error occurs when data inited
CREATE INDEX ix_item_desc ON dbo.Item(item_desc);

错误信息

Warning! The maximum key length is 900 bytes. The index 'ix_item_desc' has maximum length of 4000 bytes. For some combination of large values, the insert/update operation will fail.
Msg 1946, Level 16, State 3, Line 1
Operation failed. The index entry of length 4000 bytes for the index 'ix_item_desc' exceeds the maximum length of 900 bytes.
The statement has been terminated.

LIKE查询和Fulltext查询

--===testing performance bewteen like & fulltext
declare
    @item_desc varchar(10)
;

SELECT TOP 1 @item_desc = LEFT(item_desc, 10)
FROM dbo.Item WITH(NOLOCK) 
WHERE id = 2012;

SET STATISTICS PROFILE ON
SET STATISTICS TIME ON
SET STATISTICS IO ON

SELECT *
FROM dbo.Item WITH(NOLOCK)
WHERE item_desc like @item_desc+'%'

SELECT *
FROM dbo.Item WITH(NOLOCK)
WHERE item_desc like '%'+@item_desc+'%'

SELECT * 
FROM dbo.Item WITH(NOLOCK)
WHERE CONTAINS(item_desc,@item_desc)

SET STATISTICS TIME OFF
SET STATISTICS IO OFF
SET STATISTICS PROFILE OFF
GO

执行计划对比

非常有意思了,执行计划对比来看,Like左匹配和完全模糊匹配均走是Clustered Index Scan,相当于Table Scan;而EstimateRows显示满足条件约为12440行,也暴露出SQL Server执行计划对Like字句的评估并不准确,实际满足条件只有1行而已,所以导致最后的查询效率不高。但是,FullText的执行计划中EstimateRows显示只有1行,与实际情况相符合。
01.png

执行效率对比

对比完执行计划,让我们来看看最后执行效率对比:

  • Like左模糊匹配执行效率: Logical Reads 50185,说明IO读非常高,这是Clustered Index Scan导致的结果;CPU消耗47 ms,总的执行时间51ms。
  • Like完全模糊匹配执行效率:和Like左模糊匹配一样,Logical Reads 50185,也是IO读非常高; CPU 更加离谱达到了4789ms,执行时间4919ms。
  • FullText查询执行效率:Logical Reads仅仅只有5,所以最后CPU消耗为0ms,执行时间50ms。

从这个对比结果来看,FullText完胜LIKE字句,IO读取大大降低,CPU消耗减少,效率得到了很大的提升。

#### Like左模糊匹配执行效率
Table 'Item'. Scan count 1, logical reads 50185, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

 SQL Server Execution Times:
   CPU time = 47 ms,  elapsed time = 51 ms.

#### Like完全模糊匹配执行效率
Table 'Item'. Scan count 1, logical reads 50185, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

 SQL Server Execution Times:
   CPU time = 4789 ms,  elapsed time = 4919 ms.

#### FullText查询执行效率
Informational: The full-text search condition contained noise word(s).
Table 'Item'. Scan count 0, logical reads 5, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

 SQL Server Execution Times:
   CPU time = 0 ms,  elapsed time = 50 ms.

写在最后

完成上面的测试,菜鸟有了对老鸟和“踢馆者”合理的交代,那就是使用FullText来解决Like语句的性能问题吧。

相关实践学习
使用SQL语句管理索引
本次实验主要介绍如何在RDS-SQLServer数据库中,使用SQL语句管理索引。
SQL Server on Linux入门教程
SQL Server数据库一直只提供Windows下的版本。2016年微软宣布推出可运行在Linux系统下的SQL Server数据库,该版本目前还是早期预览版本。本课程主要介绍SQLServer On Linux的基本知识。 相关的阿里云产品:云数据库RDS&nbsp;SQL Server版 RDS SQL Server不仅拥有高可用架构和任意时间点的数据恢复功能,强力支撑各种企业应用,同时也包含了微软的License费用,减少额外支出。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/sqlserver
目录
相关文章
|
8天前
|
SQL 人工智能 算法
【SQL server】玩转SQL server数据库:第二章 关系数据库
【SQL server】玩转SQL server数据库:第二章 关系数据库
51 10
|
18天前
|
SQL
启动mysq异常The server quit without updating PID file [FAILED]sql/data/***.pi根本解决方案
启动mysq异常The server quit without updating PID file [FAILED]sql/data/***.pi根本解决方案
16 0
|
8天前
|
SQL 算法 数据库
【SQL server】玩转SQL server数据库:第三章 关系数据库标准语言SQL(二)数据查询
【SQL server】玩转SQL server数据库:第三章 关系数据库标准语言SQL(二)数据查询
66 6
|
3天前
|
SQL 安全 网络安全
IDEA DataGrip连接sqlserver 提示驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接的解决方法
IDEA DataGrip连接sqlserver 提示驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接的解决方法
8 0
|
8天前
|
SQL 存储 数据挖掘
数据库数据恢复—RAID5上层Sql Server数据库数据恢复案例
服务器数据恢复环境: 一台安装windows server操作系统的服务器。一组由8块硬盘组建的RAID5,划分LUN供这台服务器使用。 在windows服务器内装有SqlServer数据库。存储空间LUN划分了两个逻辑分区。 服务器故障&初检: 由于未知原因,Sql Server数据库文件丢失,丢失数据涉及到3个库,表的数量有3000左右。数据库文件丢失原因还没有查清楚,也不能确定数据存储位置。 数据库文件丢失后服务器仍处于开机状态,所幸没有大量数据写入。 将raid5中所有磁盘编号后取出,经过硬件工程师检测,没有发现明显的硬件故障。以只读方式将所有磁盘进行扇区级的全盘镜像,镜像完成后将所
数据库数据恢复—RAID5上层Sql Server数据库数据恢复案例
|
12天前
|
SQL 数据安全/隐私保护
SQL Server 2016安装教程
SQL Server 2016安装教程
16 1
|
12天前
|
SQL 安全 Java
SQL server 2017安装教程
SQL server 2017安装教程
14 1
|
25天前
|
SQL 存储 Python
Microsoft SQL Server 编写汉字转拼音函数
Microsoft SQL Server 编写汉字转拼音函数
|
1月前
|
SQL 存储 数据库
数据安全无忧,SQL Server 2014数据库定时备份解密
数据安全无忧,SQL Server 2014数据库定时备份解密
|
1月前
|
SQL 网络协议 Windows
破解SQL Server迷局,彻底解决“管道的另一端无任何进程错误233”
破解SQL Server迷局,彻底解决“管道的另一端无任何进程错误233”