SQL Server - Como as páginas de dados são armazenadas ao usar um índice clusterizado

Question

TomTom

Asked: 2016-04-09 00:21:00 +0800 CST2016-04-09 00:21:00 +0800 CST 2016-04-09 00:21:00 +0800 CST

Numeração de ID personalizada - maneira rápida de inserir?

772

Como início: isso é para um procedimento armazenado ETL que é serializado, portanto, o paralelismo não é motivo de preocupação.

Preciso atribuir números de ID personalizados para marcadores durante os carregamentos. Não posso usar um campo de identidade, porque os números de identificação devem ser exclusivos por um "número de balde" - essencialmente outro campo numerado.

Atualmente utilizo o seguinte código:

DECLARE @idRunner smallint
SELECT @idRunner = ISNULL(MAX([Id]),0)
    FROM sim.[Variable]
    WHERE [BucketRef] = @simBucketNo

DECLARE variable_cursor CURSOR FOR
    SELECT DISTINCT p.[Variable]
        FROM simstg.[Parameter] p
        LEFT OUTER JOIN sim.[Variable] v ON (p.[Variable] = v.[Code])
        WHERE p.[BucketRef] = @stgBucketNo
            AND v.BucketRef = @simBucketNo
            AND v.Code IS NULL
OPEN variable_cursor
DECLARE @variable VARCHAR(64)

FETCH NEXT FROM variable_cursor INTO @variable
WHILE @@FETCH_STATUS = 0
BEGIN
    SET @idRunner = @idRunner + 1
    INSERT INTO sim.[Variable] ([BucketRef], [VariableNo], [Code])
        VALUES (@simBucketNo, @idRunner, @variable)

    FETCH NEXT FROM variable_cursor INTO @variable
END

CLOSE variable_cursor
DEALLOCATE variable_cursor

e eu não gosto disso. Ele usa cursores que prefiro evitar. (Nota: este código não foi testado)

Existe uma maneira de fazer isso de forma mais eficiente, sem um cursor? Os números IR devem aumentar do mais alto usado quando novos elementos são adicionados. Existem vários baldes (por número de balde) e têm sua própria numeração.

Sempre irei processar dados para um balde por vez (um balde no sim, um no simstg).

2 respostas

Voted

ypercubeᵀᴹ · Answer 1 · 2016-04-09T01:01:05+08:00

Usando uma única instrução e ROW_NUMBER(). Com índices adequados, provavelmente será mais eficiente que cursores.

Observe que movi o p.[BucketRef] = @stgBucketNofrom the WHEREpara a ONcláusula. Do jeito que você tinha, fez o LEFT JOINtrabalho como um arquivo INNER JOIN.

WITH 
  starting (Id) AS
    ( SELECT ISNULL( ( SELECT TOP (1) v.Id 
                       FROM sim.[Variable] AS v 
                       WHERE v.BucketRef = @simBucketNo 
                       ORDER BY v.Id DESC
                     ), 0) 
    ), 
  variables AS
    ( SELECT  
          p.[Variable],
          idRunner = s.Id + ROW_NUMBER() OVER (ORDER BY p.[Variable])
        FROM starting AS s 
          CROSS JOIN simstg.[Parameter] AS p
          LEFT OUTER JOIN sim.[Variable] AS v 
            ON  p.[Variable] = v.[Code] 
            AND p.BucketRef = @stgBucketNo 
        WHERE v.BucketRef = @simBucketNo
          AND v.Code IS NULL
        GROUP BY p.[Variable]
    )
INSERT INTO sim.[Variable] 
    ([BucketRef], [VariableNo], [Code])
SELECT @simBucketNo, v.idRunner, v.[Variable]
FROM variables AS v ;

As subconsultas de tabela comuns ( WITH) existem apenas para maior clareza - e para se assemelhar ao código original. Você pode facilmente reescrever a declaração sem eles:

INSERT INTO sim.[Variable] 
    ([BucketRef], [VariableNo], [Code])
SELECT 
    @simBucketNo,
    idRunner = ISNULL( ( SELECT TOP (1) v.Id 
                         FROM sim.[Variable] AS v 
                         WHERE v.BucketRef = @simBucketNo 
                         ORDER BY v.Id DESC
                       ), 0) 
             + ROW_NUMBER() OVER (ORDER BY p.[Variable])
    p.[Variable],
FROM simstg.[Parameter] AS p
    LEFT OUTER JOIN sim.[Variable] AS v 
        ON  p.[Variable] = v.[Code] 
        AND p.BucketRef = @stgBucketNo 
WHERE v.BucketRef = @simBucketNo
  AND v.Code IS NULL
GROUP BY p.[Variable] ;

Ezequiel Tolnay · Answer 2 · 2016-04-09T00:57:53+08:00

Ezequiel Tolnay

2016-04-09T00:57:53+08:002016-04-09T00:57:53+08:00

Você pode usar uma coluna de identidade em uma tabela temporária para evitar um cursor. Isso é especialmente conveniente com versões mais antigas do SQL Server que não oferecem suporte a WITHfunções de janela.

CREATE TABLE #Variable ([VariableNo] int IDENTITY NOT NULL, [Code] varchar(4000) NOT NULL)
INSERT INTO #Variable ([Code])
    SELECT DISTINCT p.[Variable]
        FROM simstg.[Parameter] p
        LEFT OUTER JOIN sim.[Variable] v ON (p.[Variable] = v.[Code])
        WHERE p.[BucketRef] = @stgBucketNo
            AND v.BucketRef = @simBucketNo
            AND v.Code IS NULL;

DECLARE @CurID smallint
SELECT @CurID = ISNULL(MAX([Id]),0)
    FROM sim.[Variable]
    WHERE [BucketRef] = @simBucketNo

INSERT INTO sim.[Variable] ([BucketRef], [VariableNo], [Code])
SELECT @simBucketNo, [VariableNo]+@CurID, [Code]
FROM #Variable

DROP TABLE #Variable

4

Numeração de ID personalizada - maneira rápida de inserir?

conectar ao servidor PostgreSQL: FATAL: nenhuma entrada pg_hba.conf para o host

Como fazer a saída do sqlplus aparecer em uma linha?

Selecione qual tem data máxima ou data mais recente

Como faço para listar todos os esquemas no PostgreSQL?

Listar todas as colunas de uma tabela especificada

Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

Como você mysqldump tabela (s) específica (s)?

Listar os privilégios do banco de dados usando o psql

Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

Como faço para listar todos os bancos de dados e tabelas usando o psql?

Numeração de ID personalizada - maneira rápida de inserir?

2 respostas

relate perguntas