AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 39101
Accepted
Michael Fredrickson
Michael Fredrickson
Asked: 2013-04-03 15:39:24 +0800 CST2013-04-03 15:39:24 +0800 CST 2013-04-03 15:39:24 +0800 CST

带有参数化 LIKE 的意外表扫描

  • 772

在对语句进行参数化时,我在 SQL Server 2005 上遇到了针对堆表的意外表扫描LIKE......但是当与变量相同的值被硬编码时,预期的索引查找就会发生。

这个问题只发生在这种特定情况下......所以我对如何解决这个问题并不感到困惑,我对为什么会发生这种情况感到困惑。

以下 T-SQL 应该会在 SQL Server 2005 上重现该问题:

IF (OBJECT_ID('tempdb.dbo.#tblTest') IS NOT NULL)
    DROP TABLE dbo.#tblTest
GO

CREATE TABLE dbo.#tblTest (
    ID INT IDENTITY(1, 1),
    SerialNumber VARCHAR(50)
)
GO

-- Populate the table with 10,000 rows
SET NOCOUNT ON
DECLARE @i INT
SET @i = 0

WHILE @i < 10000
BEGIN
    INSERT INTO dbo.#tblTest VALUES(CAST(@i AS VARCHAR(10)))
    SET @i = @i + 1
END
GO

-- To recreate the issue, the table must be a heap.
ALTER TABLE dbo.#tblTest ADD CONSTRAINT PK_tblTest PRIMARY KEY NONCLUSTERED (ID)
GO

-- Create a (non-covering) index on serial number.
CREATE NONCLUSTERED INDEX IX_tblTest_SerialNumber ON dbo.#tblTest (SerialNumber)
GO

DECLARE @Criteria VARCHAR(50)
SET @Criteria = '1234%'

-- This produces a Table Scan.
SELECT * 
FROM dbo.#tblTest
WHERE SerialNumber LIKE @Criteria

-- This produces an Index Seek
SELECT *
FROM dbo.#tblTest
WHERE SerialNumber LIKE '1234%'

Paul White 的这篇文章似乎与我密切相关,但结论/解释与我的具体问题不符。

任何见解表示赞赏。

sql-server sql-server-2005
  • 1 1 个回答
  • 1151 Views

1 个回答

  • Voted
  1. Best Answer
    孔夫子
    2013-04-03T15:57:41+08:002013-04-03T15:57:41+08:00

    它仅针对非聚集索引出现的说法是因为您只有两列 - 一个是索引列,另一个是

    1. 如果有聚簇索引,则为聚簇键(即另一列)
    2. 如果没有聚簇索引,则为 RID

    在第二种情况下,为了满足SELECT *查询的(所有列)部分,它必须执行昂贵的查找,因此选择执行 10,000* 记录表扫描的通用(稳健)计划。在第一种情况下,索引就是满足 SELECT 子句所需的全部内容。

    *应该注意的是,记录数和索引基数也在确定计划中发挥作用。

    对于更多的列,计划可预见地切换到参数化 LIKE 语句的 CLUSTERED INDEX SCAN,即使使用聚集索引,根据下面的修订测试。

    IF (OBJECT_ID('tempdb.dbo.#tblTest') IS NOT NULL)
        DROP TABLE dbo.#tblTest
    GO
    
    CREATE TABLE dbo.#tblTest (
        ID INT IDENTITY(1, 1),
        SerialNumber VARCHAR(50),
        Othercolumn1 uniqueidentifier default (newid()),
        RowVer timestamp
    )
    GO
    
    -- Populate the table with 10,000 rows
    SET NOCOUNT ON
    DECLARE @i INT
    SET @i = 0
    
    WHILE @i < 10000
    BEGIN
        INSERT INTO dbo.#tblTest (serialnumber) VALUES(CAST(@i AS VARCHAR(10)))
        SET @i = @i + 1
    END
    GO
    
    -- To recreate the issue, the table must be a heap.
    ALTER TABLE dbo.#tblTest ADD CONSTRAINT PK_tblTest PRIMARY KEY CLUSTERED (ID)
    GO
    
    -- Create a (non-covering) index on serial number.
    CREATE NONCLUSTERED INDEX IX_tblTest_SerialNumber ON dbo.#tblTest (SerialNumber)
    GO
    
    DECLARE @Criteria VARCHAR(50)
    SET @Criteria = '1234%'
    
    -- This produces a Table Scan.
    SELECT * 
    FROM dbo.#tblTest
    WHERE SerialNumber LIKE @Criteria
    
    -- This produces an Index Seek
    SELECT *
    FROM dbo.#tblTest
    WHERE SerialNumber LIKE '1234%'
    

    以下是根据我修改后的表结构生成的计划。对于问题中的架构,顶部变为表扫描,底部变为 RID 查找而不是密钥查找 - 其他所有条件都相同。

    执行计划

    执行查询中成本较高的操作之一是首先构建执行计划。为了帮助解决这个问题,SQL Server 有一个计划缓存来存储语句的文本和相关的 SET 设置。使用不同 SET 设置的相同文本可能会导致不同的行为,因此需要重新规划并存储为单独的条目。

    非参数化查询很容易计划 - 它包含确切的文本“1234%”。SerialNumber 上的 VARCHAR 索引很容易搜索包含前缀“1234”的部分。SQL Server 还会估计查询的基数并且总是会为您的数据选择 INDEX SEEK 计划。向 SQL Server 进一步提供确切的查询语句(文本)将包含静态值“1234%”,并且可以安全地高效地重新执行相同的计划。

    另一方面,参数化查询存储到由语句文本键入的计划缓存(字典)中... WHERE SerialNumber LIKE @Criteria。尽管当前批次中的@Criteria 包含值“1234%”并且可以使用 INDEX SEEK,但另一个用户很有可能提交完全相同的查询并将其@Criteria设置为“%9”而不是使用INDEX SEEK + RID 查找。这将选择 10% 的数据,这些数据通常超过索引搜索不再有利的临界点。为了健壮性和可重用性,为该查询缓存(然后执行)的计划是表扫描版本,它将以@Criteria可能值的平均效率满足最广泛的值范围。

    • 5

相关问题

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

  • 从 SQL Server 2008 降级到 2005

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    授予用户对所有表的访问权限

    • 5 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta 使用 psql 列出数据库权限 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve