AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 335133
Accepted
Dryadwoods
Dryadwoods
Asked: 2024-01-24 17:48:13 +0800 CST2024-01-24 17:48:13 +0800 CST 2024-01-24 17:48:13 +0800 CST

MS SQL Server - 具有队列逻辑的表 - 如何确定并行任务不会检索相同的 ID?

  • 772

我有一个表,sys_QueueJob存储队列逻辑数据。

我认为更新并返回就足够了...但是,现在我不确定这是否 100% 安全。

我如何确定无论有多少并行请求都不会返回相同的 ID?

UPDATE sys_QueueJob
SET ExecutionStartedOn = GETDATE()
OUTPUT DELETED.Id as Result
WHERE Id = (select top 1 x.Id
            from sys_QueueJob x with (rowlock, updlock, readpast)
                        where x.ExecutionFinishedOn is null
                            AND (
                                x.ExecutionStartedOn is null
                                OR x.ExecutionStartedOn < DATEADD(HOUR, -1, GETDATE())
                               )
                        order by x.CreatedOn asc)
sql-server
  • 2 2 个回答
  • 631 Views

2 个回答

  • Voted
  1. Best Answer
    Erik Darling
    2024-01-24T20:24:25+08:002024-01-24T20:24:25+08:00

    排队

    就像我在这篇文章中讨论的那样,处理队列的可靠方法是使用如下查询:

    WITH 
        q AS
    (
        SELECT TOP (1) 
            x.* 
        FROM sys_QueueJob x WITH (ROWLOCK, UPDLOCK, READPAST)
        WHERE x.ExecutionFinishedOn IS NULL
        AND 
        (
              x.ExecutionStartedOn IS NULL 
           OR x.ExecutionStartedOn < DATEADD(HOUR, -1, GETDATE())
        )
        ORDER BY 
            x.CreatedOn ASC
            /*You may need to also order by Id if CreatedOn isn't unique*/
    )
    UPDATE 
        q
    SET 
        ExecutionStartedOn = GETDATE()
    OUTPUT 
        Deleted.Id as Result;
    

    当然,对于大多数队列查询来说,更大的挑战是对其建立索引以使工作易于分发。通常,排除已完成工作 (ExecutionFinishedOn) 的过滤索引和过滤/排序元素上的键(ExecutionStartedOn、CreatedOn)就足够了。

    就您而言,您要查找尚未开始的项目和一个多小时前开始的项目。将它们分成两个独立查找每个配置的“工作人员”可能更有意义,或者如果没有找到尚未开始的行,则添加一些逻辑来查找一个多小时前开始的行。

    比较技术

    我使用公用表表达式而不是使用子查询进行更新的原因是为了避免查询计划对表进行多次锁定调用。

    看一下这个示例,它使用一个名为dbo.WhatsUpLocks的小帮助器视图来汇总会话持有的锁。我还使用扩展事件来观察更新查询运行时在表和相关对象(索引、默认约束等)上获取和释放的锁。

    第一种技术

    BEGIN TRANSACTION;
        DECLARE
            @id integer, 
            @reputation integer;
    
        WITH 
            q4 AS
        (
            SELECT TOP (1) 
                fq.*
            FROM dbo.four_queue AS fq WITH(READPAST, ROWLOCK, UPDLOCK)
            WHERE fq.in_process = 0
            ORDER BY 
                fq.id
        )
        UPDATE q4
        SET 
            q4.in_process = 1,
            q4.start_date = SYSDATETIME(),
            @id = q4.id,
            @reputation = q4.reputation
        FROM q4;
        
        SELECT
            wul.*
        FROM dbo.WhatsUpLocks(@@SPID) AS wul;
    ROLLBACK;
    GO 
    

    这是查询计划,其中包含对该表的单个读取引用:

    坚果

    以下是查询执行期间获取和释放的锁:

    坚果

    以下是事务回滚之前保留的锁:

    坚果

    第二种技术

    让我们将其与您最初的尝试进行比较,该尝试应用于我之前链接的帖子中的表设置。

    BEGIN TRANSACTION;
        DECLARE
            @id integer, 
            @reputation integer;
    
        UPDATE 
            q4
        SET
            q4.in_process = 1,
            q4.start_date = SYSDATETIME(),
            @id = q4.id,
            @reputation = q4.reputation
        FROM dbo.four_queue AS q4
        WHERE q4.id = 
        (
            SELECT TOP (1) 
                x.id
            FROM dbo.four_queue AS x WITH (ROWLOCK, UPDLOCK, READPAST)
            WHERE x.in_process = 0
            ORDER BY 
                x.id
        );
    
        SELECT
            wul.*
        FROM dbo.WhatsUpLocks(@@SPID) AS wul;
    ROLLBACK;
    GO 
    

    这是查询计划,现在有两个对该表的读取引用:

    坚果

    以下是查询执行期间获取和释放的锁:

    坚果

    以下是事务回滚之前保留的锁:

    坚果

    差异

    查询执行期间获取和释放的锁有很大不同。公共表表达式中的数量比使用子查询更新中的少得多,这主要是因为查询计划中只有单个读取和更新引用。

    在查询回滚之前,剩余的锁只有细微的差别。我的结果中的底行显示了页面上的 IX 锁,而您的结果显示了页面上的 UIX 锁。

    这些差异加起来有多少取决于处理队列时的并发性,但您最好以正确的方式进行处理,这样您就不必担心它稍后会崩溃。

    最后一点,我不希望您放弃这样的想法:公用表表达式是有魔力的。他们不是。您可以使用派生表或创建的视图(生成要更新的单个结果)获得相同的结果,而无需使用子查询。在这种情况下,我发现公共表表达式使查询更容易理解。就这些。

    • 5
  2. Alocyte
    2024-01-24T19:33:34+08:002024-01-24T19:33:34+08:00

    我相信(测试将证明)使用

    CREATE TABLE BLAH (
    ID INT IDENTITY(1,1) PRIMARY KEY,
    StartTime DATETIME,
    EndTime DATETIME,
    FinishedTime DATETIME,
    TH INT,
    CreatedTime DATETIME DEFAULT GETDATE()
    )
    
    INSERT INTO Blah (TH)
    SELECT TOp 100 (TH)
    FROM (
            SELECT ROW_NUMBER() OVER (ORDER BY a.object_id) TH
            FROM sys.objects a
        ) a1
    
    BEGIN TRANSACTION 
    UPDATE table1 
      SET StartTime = GETDATE() 
     OUTPUT DELETED.ID  
     FROM BLAH table1
        JOIN (  SELECT TOP 1 ID 
                FROM BLAH table2
                WHERE StartTime IS NULL
                ORDER BY CreatedTime ASC) Selector
     ON Selector.ID = table1.ID
     WHERE StartTime is null 
    COMMIT --TRANSACTION
    

    将在该事务期间锁定表以进行更新,因此您可以捕获未处理的 ID 并可以继续处理该行 - 而另一个调用将捕获下一行。

    如果您阅读https://learn.microsoft.com/en-us/sql/relational-databases/sql-server-transaction-locking-and-row-versioning-guide?view=sql-server-ver16 这将有助于了解如何在 SQL 中管理内容。

    在我看来,您正在重新处理设置了 StartTime 且一小时内尚未完成的记录?可能需要调整 where 子句以包含该内容。或者让进程在崩溃时将 ID 更新开始时间处理为 NULL...将自动再次可供选择。

    事实上,运行创建、插入和更新(无需提交)并再次运行更新(无需提交),输出 1 然后 2 - 不要忘记在测试后提交两次以关闭打开的事务。

    • 1

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve