AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 200352
Accepted
Rahul Hendawe
Rahul Hendawe
Asked: 2018-03-16 05:06:49 +0800 CST2018-03-16 05:06:49 +0800 CST 2018-03-16 05:06:49 +0800 CST

Como ignorar linhas duplicadas na instrução CTE Select?

  • 772

Estou tentando ignorar linhas duplicadas de um CTE, mas não consigo fazer isso, parece que um CTE não permite usar ROWNUM()variável para WHEREcláusula, pois está mostrando o erro " Nome de coluna inválido 'numrows' " ao tentar fazê-lo .

Como ignoro as linhas duplicadas ao usar SELECTem um CTE?

Consulta SQL:

DECLARE @BatchID uniqueidentifier = NEWID();
DECLARE @ClusterID SMALLINT = 1;
DECLARE @BatchSize integer = 20000;
DECLARE @myTableVariable TABLE(
    EventID BIGINT,
    HotelID int,
    BatchStatus varchar(50),
    BatchID uniqueidentifier);

WITH PendingExtResSvcEventsData_Batch AS (
    SELECT TOP (@BatchSize) t.EventID, t.HotelID, t.BatchStatus, t.BatchID,
        ROW_NUMBER() OVER (PARTITION BY t.EventID ORDER BY t.EventID) numrows 
    FROM ExtResSvcPendingMsg t WITH (NOLOCK)
    WHERE t.ClusterID = @ClusterID
      AND numrows = 1
      -- Exclude ExtResSvcEventID and HotelID,
      -- which are partly included in in-progress batch.
      AND NOT EXISTS (
          select 1 from ExtResSvcPendingMsg t2
          where t2.BatchStatus = 'Batched'
            and t2.EventID = t.EventID and t2.HotelID = t.HotelID
          )
    )
UPDATE PendingExtResSvcEventsData_Batch
   SET BatchStatus='Batched',
       BatchID = @BatchID
OUTPUT INSERTED.* INTO @myTableVariable --WHERE numrows = 1

SELECT e.ExtResSvcEventID, e.HotelID, e.ID1, e.ID2, e.ExtResSvcEventType, e.HostID,
       e.StatusCode, e.ChannelID, e.RequestAtTime, e.ProcessTime, e.DateBegin, e.DateEnd,
       e.StatusMsg, em.MsgBodyOut, em.MsgBodyIn, e.ChannelResID 
FROM  ExtResSvcEvent e WITH (NOLOCK)
INNER JOIN @myTableVariable t ON e.ExtResSvcEventID = t.EventID
INNER JOIN ExtResSvcEventXML em WITH (NOLOCK) ON t.EventID = em.ExtResSvcEventID
ORDER BY e.ExtResSvcEventID
sql-server t-sql
  • 3 3 respostas
  • 1410 Views

3 respostas

  • Voted
  1. Andriy M
    2018-03-16T09:10:24+08:002018-03-16T09:10:24+08:00

    Não use INSERTED.*aqui:

    OUTPUT INSERTED.* INTO @myTableVariable
    

    Em vez disso, liste as colunas explicitamente:

    OUTPUT INSERTED.EventID,
           INSERTED.HotelID,
           INSERTED.BatchStatus,
           INSERTED.BatchID
    INTO @myTableVariable
    

    O *significa todas as colunas do conjunto de dados de destino. O conjunto de dados de destino no seu caso é um CTE que, além das colunas normais, retorna uma coluna calculada. A INSERTED.*sintaxe também inclui a coluna calculada, mas a referência a uma coluna calculada não é permitida nesse contexto. Listar todas as colunas necessárias resolve o problema explicitamente.

    E você pode usar o numrowsfiltro nesse UPDATE (mas não dentro do CTE). A numrowsreferência será válida em todos os lugares, exceto na cláusula OUTPUT e no lado esquerdo de uma atribuição na cláusula SET.

    Aqui está uma demo , que descaradamente empresta a configuração de ypercubeᵀᴹ, bem como sua declaração UPDATE.

    • 5
  2. Best Answer
    ypercubeᵀᴹ
    2018-03-16T08:34:25+08:002018-03-16T08:34:25+08:00

    Eu esperaria que isso funcionasse, mas sem definições de tabela, não podemos ter certeza:

    WITH 
    PendingExtResSvcEventsData_Batch 
       (...),                           -- your CTE here
    upd AS
      ( SELECT EventID, HotelID, BatchStatus, BatchID 
        FROM PendingExtResSvcEventsData_Batch 
        WHERE numrows = 1
      )
    UPDATE upd
    SET BatchStatus = 'Batched',  
        BatchID = @BatchID
    OUTPUT INSERTED.* INTO @myTableVariable ;
    

    Um teste simplificado em: dbfiddle.uk

    No entanto, há mais problemas com a consulta:

    • Qual é a razão por trás do uso de NOLOCKdica? Sugiro que você o remova, a menos que tenha uma razão para isso - e tenha lido sobre as consequências e aceite o comportamento.
    • Você tem SELECT TOP (@BatchSize)sem um específico ORDER BY. Isso significa que linhas arbitrárias serão selecionadas para serem retornadas por essa subconsulta.
    • Combinado com o WHERE numrows = 1que você deseja aplicar na próxima etapa, isso significa que a atualização pode afetar menos linhas do que o especificado @Batchsize, possivelmente até mesmo apenas uma.
    • 4
  3. paparazzo
    2018-03-16T05:53:01+08:002018-03-16T05:53:01+08:00

    Não use nolockaqui

    PARTITION BY t.EventID ORDER BY t.EventIDserá uma ordem arbitrária. Tem certeza que é isso que você quer.

    topsem e ordenar por é arbitrary. Você está agrupando parcialmente, mas exclui lotes parciais. Isso me parece errado.

    Você pode apenas usar numrowsna seleção final.

    DECLARE @BatchID uniqueidentifier = NEWID();
    DECLARE @ClusterID SMALLINT = 1;
    DECLARE @BatchSize integer = 20000;
    DECLARE @myTableVariable TABLE(EventID BIGINT,HotelID int, BatchStatus varchar(50),BatchID uniqueidentifier);
    
    WITH PendingExtResSvcEventsData_Batch AS
    (  SELECT TOP (@BatchSize) t.EventID, t.HotelID, t.BatchStatus, t.BatchID
           ,  ROW_NUMBER() OVER (PARTITION BY t.EventID ORDER BY t.EventID) numrows 
         FROM ExtResSvcPendingMsg t  
        WHERE t.ClusterID = @ClusterID 
          AND numrows = 1 
          AND NOT EXISTS ( select 1 
                             from ExtResSvcPendingMsg t2 
                            where t2.BatchStatus = 'Batched' 
                              and t2.EventID = t.EventID 
                              and t2.HotelID = t.HotelID       
                          )
    )        
    UPDATE PendingExtResSvcEventsData_Batch 
       SET BatchStatus = 'Batched',  
           BatchID = @BatchID
    OUTPUT INSERTED.* INTO @myTableVariable --WHERE numrows = 1
    
    SELECT e.ExtResSvcEventID, e.HotelID, e.ID1, e.ID2, e.ExtResSvcEventType, e.HostID, e.StatusCode, e.ChannelID, e.RequestAtTime, e.ProcessTime, e.DateBegin, e.DateEnd, e.StatusMsg, em.MsgBodyOut, em.MsgBodyIn, e.ChannelResID 
      FROM ExtResSvcEvent e WITH (NOLOCK) 
     INNER JOIN @myTableVariable t 
        ON e.ExtResSvcEventID = t.EventID    
       AND t.numrows = 1 
     INNER JOIN ExtResSvcEventXML em with (nolock) 
        on t.EventID = em.ExtResSvcEventID            
     ORDER BY e.ExtResSvcEventID
    

    Por que produzir todas as linhas. Parece que você está usando apenas t.EventID.

    • -1

relate perguntas

  • SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

  • Preciso de índices separados para cada tipo de consulta ou um índice de várias colunas funcionará?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

    • 12 respostas
  • Marko Smith

    Como fazer a saída do sqlplus aparecer em uma linha?

    • 3 respostas
  • Marko Smith

    Selecione qual tem data máxima ou data mais recente

    • 3 respostas
  • Marko Smith

    Como faço para listar todos os esquemas no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Jin conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane Como faço para listar todos os esquemas no PostgreSQL? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve