AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 335133
Accepted
Dryadwoods
Dryadwoods
Asked: 2024-01-24 17:48:13 +0800 CST2024-01-24 17:48:13 +0800 CST 2024-01-24 17:48:13 +0800 CST

MS SQL Server - Tabela com lógica de fila - Como posso ter certeza de que tarefas paralelas não recuperarão o mesmo ID?

  • 772

Eu tenho uma tabela sys_QueueJobque armazena dados lógicos da fila.

Achei que bastaria ter uma atualização com retorno... Porém, agora não tenho certeza se isso é 100% seguro.

Como posso ter certeza de que, independentemente de muitas solicitações paralelas, não retornarão o mesmo ID?

UPDATE sys_QueueJob
SET ExecutionStartedOn = GETDATE()
OUTPUT DELETED.Id as Result
WHERE Id = (select top 1 x.Id
            from sys_QueueJob x with (rowlock, updlock, readpast)
                        where x.ExecutionFinishedOn is null
                            AND (
                                x.ExecutionStartedOn is null
                                OR x.ExecutionStartedOn < DATEADD(HOUR, -1, GETDATE())
                               )
                        order by x.CreatedOn asc)
sql-server
  • 2 2 respostas
  • 631 Views

2 respostas

  • Voted
  1. Best Answer
    Erik Darling
    2024-01-24T20:24:25+08:002024-01-24T20:24:25+08:00

    na fila

    Como falo neste post , uma maneira confiável de processar filas é usar uma consulta como esta:

    WITH 
        q AS
    (
        SELECT TOP (1) 
            x.* 
        FROM sys_QueueJob x WITH (ROWLOCK, UPDLOCK, READPAST)
        WHERE x.ExecutionFinishedOn IS NULL
        AND 
        (
              x.ExecutionStartedOn IS NULL 
           OR x.ExecutionStartedOn < DATEADD(HOUR, -1, GETDATE())
        )
        ORDER BY 
            x.CreatedOn ASC
            /*You may need to also order by Id if CreatedOn isn't unique*/
    )
    UPDATE 
        q
    SET 
        ExecutionStartedOn = GETDATE()
    OUTPUT 
        Deleted.Id as Result;
    

    Obviamente, o maior desafio para a maioria das consultas de fila é indexá-las para facilitar a distribuição do trabalho. Normalmente, um índice filtrado que exclui o trabalho concluído (ExecutionFinishedOn) e chaves nos elementos de filtragem/classificação é suficiente (ExecutionStartedOn, CriadoOn).

    No seu caso, você está procurando itens que não foram iniciados e itens que foram iniciados há mais de uma hora. Pode fazer mais sentido dividi-los em dois "trabalhadores" que procuram cada disposição de forma independente ou adicionar alguma lógica para procurar linhas iniciadas há mais de uma hora, se nenhuma linha for encontrada que ainda não tenha sido iniciada.

    comparando técnicas

    A razão pela qual usei uma expressão de tabela comum em vez de uma atualização com uma subconsulta é para evitar um plano de consulta com múltiplas chamadas de bloqueio para a tabela.

    Dê uma olhada neste exemplo, que usa uma pequena visualização auxiliar chamada dbo.WhatsUpLocks para resumir os bloqueios mantidos por uma sessão. Também estou usando Eventos Estendidos para observar bloqueios adquiridos e liberados em minha tabela e objetos relacionados (índices, restrições padrão, etc.) quando a consulta de atualização é executada.

    primeira técnica

    BEGIN TRANSACTION;
        DECLARE
            @id integer, 
            @reputation integer;
    
        WITH 
            q4 AS
        (
            SELECT TOP (1) 
                fq.*
            FROM dbo.four_queue AS fq WITH(READPAST, ROWLOCK, UPDLOCK)
            WHERE fq.in_process = 0
            ORDER BY 
                fq.id
        )
        UPDATE q4
        SET 
            q4.in_process = 1,
            q4.start_date = SYSDATETIME(),
            @id = q4.id,
            @reputation = q4.reputation
        FROM q4;
        
        SELECT
            wul.*
        FROM dbo.WhatsUpLocks(@@SPID) AS wul;
    ROLLBACK;
    GO 
    

    Aqui está o plano de consulta, com uma única referência de leitura para a tabela:

    NOZES

    Aqui estão os bloqueios que foram obtidos e liberados durante a execução da consulta:

    NOZES

    E aqui estão os bloqueios que permanecem antes da transação ser revertida:

    NOZES

    segunda técnica

    Vamos comparar isso com sua tentativa inicial, aplicada à configuração da tabela na postagem que linkei anteriormente.

    BEGIN TRANSACTION;
        DECLARE
            @id integer, 
            @reputation integer;
    
        UPDATE 
            q4
        SET
            q4.in_process = 1,
            q4.start_date = SYSDATETIME(),
            @id = q4.id,
            @reputation = q4.reputation
        FROM dbo.four_queue AS q4
        WHERE q4.id = 
        (
            SELECT TOP (1) 
                x.id
            FROM dbo.four_queue AS x WITH (ROWLOCK, UPDLOCK, READPAST)
            WHERE x.in_process = 0
            ORDER BY 
                x.id
        );
    
        SELECT
            wul.*
        FROM dbo.WhatsUpLocks(@@SPID) AS wul;
    ROLLBACK;
    GO 
    

    Aqui está o plano de consulta, que agora possui duas referências de leitura para a tabela:

    NOZES

    Aqui estão os bloqueios que foram obtidos e liberados durante a execução da consulta:

    NOZES

    E aqui estão os bloqueios que permanecem antes da transação ser revertida:

    NOZES

    diferenças

    Os bloqueios adquiridos e liberados durante a execução da consulta são muito diferentes. Há muito menos na expressão de tabela comum do que na atualização com subconsulta, em grande parte devido à referência única de leitura e atualização no plano de consulta.

    Há apenas uma pequena diferença nos bloqueios restantes antes da consulta ser revertida. A linha inferior do meu resultado mostra um bloqueio IX nas páginas e a sua mostra bloqueios UIX nas páginas.

    A soma dessas diferenças depende da simultaneidade durante o processamento das filas, mas você também pode fazer isso da maneira certa para não precisar se preocupar com o colapso mais tarde.

    Como nota final, não quero que você saia desse pensamento de que expressões comuns de mesa são mágicas. Eles não são. Você poderia obter os mesmos resultados com uma tabela derivada ou uma visualização criada que produzisse um único resultado para atualização, sem o uso de uma subconsulta. Nesse caso, acho que a expressão de tabela comum torna a consulta mais compreensível. Isso é tudo.

    • 5
  2. Alocyte
    2024-01-24T19:33:34+08:002024-01-24T19:33:34+08:00

    Acredito que (os testes provarão) usando

    CREATE TABLE BLAH (
    ID INT IDENTITY(1,1) PRIMARY KEY,
    StartTime DATETIME,
    EndTime DATETIME,
    FinishedTime DATETIME,
    TH INT,
    CreatedTime DATETIME DEFAULT GETDATE()
    )
    
    INSERT INTO Blah (TH)
    SELECT TOp 100 (TH)
    FROM (
            SELECT ROW_NUMBER() OVER (ORDER BY a.object_id) TH
            FROM sys.objects a
        ) a1
    
    BEGIN TRANSACTION 
    UPDATE table1 
      SET StartTime = GETDATE() 
     OUTPUT DELETED.ID  
     FROM BLAH table1
        JOIN (  SELECT TOP 1 ID 
                FROM BLAH table2
                WHERE StartTime IS NULL
                ORDER BY CreatedTime ASC) Selector
     ON Selector.ID = table1.ID
     WHERE StartTime is null 
    COMMIT --TRANSACTION
    

    irá LOCK a tabela para UPDATE durante essa transação, para que você capture o ID não processado e possa prosseguir com o processamento dessa linha - enquanto outra chamada captura a próxima.

    se você ler https://learn.microsoft.com/en-us/sql/relational-databases/sql-server-transaction-locking-and-row-versioning-guide?view=sql-server-ver16 isso ajudará a ver como as coisas são gerenciadas no SQL.

    Parece-me que você está reprocessando registros com StartTime configurado que não terminam há uma hora? pode ser necessário ajustar a cláusula where para incluí-la. Ou faça com que o processo processando o horário de início da atualização do ID para NULL quando ele travar... estará automaticamente disponível para seleção novamente.

    Na verdade, executar create, insert e update (sem commit) e executar a atualização novamente (sem commit), gera 1 e depois 2 - não se esqueça de COMMIT duas vezes para fechar transações abertas após o teste.

    • 1

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve