AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / dba / Perguntas / 22217
Accepted
Geoff Patterson
Geoff Patterson
Asked: 2012-08-10 01:48:11 +0800 CST2012-08-10 01:48:11 +0800 CST 2012-08-10 01:48:11 +0800 CST

O SQL Server não otimiza a junção de mesclagem paralela em duas tabelas particionadas de forma equivalente

  • 772

Desculpas antecipadamente pela pergunta muito detalhada. Incluí consultas para gerar um conjunto de dados completo para reproduzir o problema e estou executando o SQL Server 2012 em uma máquina de 32 núcleos. No entanto, não acho que isso seja específico do SQL Server 2012 e forcei um MAXDOP de 10 para este exemplo específico.

Eu tenho duas tabelas que são particionadas usando o mesmo esquema de partição. Ao juntá-los na coluna usada para particionamento, notei que o SQL Server não é capaz de otimizar uma junção de mesclagem paralela tanto quanto se poderia esperar e, portanto, optou por usar um HASH JOIN. Nesse caso específico, posso simular manualmente um MERGE JOIN paralelo muito mais ideal, dividindo a consulta em 10 intervalos separados com base na função de partição e executando cada uma dessas consultas simultaneamente no SSMS. Usando WAITFOR para executá-los precisamente ao mesmo tempo, o resultado é que todas as consultas são concluídas em aproximadamente 40% do tempo total usado pelo HASH JOIN paralelo original.

Existe alguma maneira de fazer com que o SQL Server faça essa otimização por conta própria no caso de tabelas particionadas de forma equivalente? Eu entendo que o SQL Server geralmente pode incorrer em muita sobrecarga para fazer um MERGE JOIN paralelo, mas parece que há um método de fragmentação muito natural com sobrecarga mínima neste caso. Talvez seja apenas um caso especializado que o otimizador ainda não é inteligente o suficiente para reconhecer?

Aqui está o SQL para configurar um conjunto de dados simplificado para reproduzir este problema:

/* Create the first test data table */
CREATE TABLE test_transaction_properties 
    ( transactionID INT NOT NULL IDENTITY(1,1)
    , prop1 INT NULL
    , prop2 FLOAT NULL
    )

/* Populate table with pseudo-random data (the specific data doesn't matter too much for this example) */
;WITH E1(N) AS (
    SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 
    UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
)
, E2(N) AS (SELECT 1 FROM E1 a CROSS JOIN E1 b)
, E4(N) AS (SELECT 1 FROM E2 a CROSS JOIN E2 b)
, E8(N) AS (SELECT 1 FROM E4 a CROSS JOIN E4 b)
INSERT INTO test_transaction_properties WITH (TABLOCK) (prop1, prop2)
SELECT TOP 10000000 (ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) % 5) + 1 AS prop1
                , ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) * rand() AS prop2
FROM E8

/* Create the second test data table */
CREATE TABLE test_transaction_item_detail
    ( transactionID INT NOT NULL
    , productID INT NOT NULL
    , sales FLOAT NULL
    , units INT NULL
    )

 /* Populate the second table such that each transaction has one or more items
     (again, the specific data doesn't matter too much for this example) */
INSERT INTO test_transaction_item_detail WITH (TABLOCK) (transactionID, productID, sales, units)
SELECT t.transactionID, p.productID, 100 AS sales, 1 AS units
FROM test_transaction_properties t
JOIN (
    SELECT 1 as productRank, 1 as productId
    UNION ALL SELECT 2 as productRank, 12 as productId
    UNION ALL SELECT 3 as productRank, 123 as productId
    UNION ALL SELECT 4 as productRank, 1234 as productId
    UNION ALL SELECT 5 as productRank, 12345 as productId
) p
    ON p.productRank <= t.prop1

/* Divides the transactions evenly into 10 partitions */
CREATE PARTITION FUNCTION [pf_test_transactionId] (INT)
AS RANGE RIGHT
FOR VALUES
(1,1000001,2000001,3000001,4000001,5000001,6000001,7000001,8000001,9000001)

CREATE PARTITION SCHEME [ps_test_transactionId]
AS PARTITION [pf_test_transactionId]
ALL TO ( [PRIMARY] )

/* Apply the same partition scheme to both test data tables */
ALTER TABLE test_transaction_properties
ADD CONSTRAINT PK_test_transaction_properties
PRIMARY KEY (transactionID)
ON ps_test_transactionId (transactionID)

ALTER TABLE test_transaction_item_detail
ADD CONSTRAINT PK_test_transaction_item_detail
PRIMARY KEY (transactionID, productID)
ON ps_test_transactionId (transactionID)

Agora estamos finalmente prontos para reproduzir a consulta abaixo do ideal!

/* This query produces a HASH JOIN using 20 threads without the MAXDOP hint,
    and the same behavior holds in that case.
    For simplicity here, I have limited it to 10 threads. */
SELECT COUNT(*)
FROM test_transaction_item_detail i
JOIN test_transaction_properties t
    ON t.transactionID = i.transactionID
OPTION (MAXDOP 10)

insira a descrição da imagem aqui

insira a descrição da imagem aqui

No entanto, usar um único thread para processar cada partição (exemplo para a primeira partição abaixo) levaria a um plano muito mais eficiente. Eu testei isso executando uma consulta como a abaixo para cada uma das 10 partições precisamente no mesmo momento, e todas as 10 terminaram em pouco mais de 1 segundo:

SELECT COUNT(*)
FROM test_transaction_item_detail i
INNER MERGE JOIN test_transaction_properties t
    ON t.transactionID = i.transactionID
WHERE t.transactionID BETWEEN 1 AND 1000000
OPTION (MAXDOP 1)

insira a descrição da imagem aqui insira a descrição da imagem aqui

sql-server join
  • 2 2 respostas
  • 6835 Views

2 respostas

  • Voted
  1. Best Answer
    Paul White
    2012-08-30T02:31:04+08:002012-08-30T02:31:04+08:00

    Você está certo que o otimizador do SQL Server prefere não gerar MERGEplanos de junção paralelos (essa alternativa custa bastante). Paralelo MERGEsempre requer trocas de reparticionamento em ambas as entradas de junção e, mais importante, requer que a ordem das linhas seja preservada nessas trocas.

    O paralelismo é mais eficiente quando cada encadeamento pode ser executado independentemente; a preservação de ordem geralmente leva a esperas frequentes de sincronização e pode, em última análise, fazer com que as trocas se espalhem para tempdbresolver uma condição de impasse dentro da consulta.

    Esses problemas podem ser contornados executando várias instâncias de toda a consulta em um encadeamento cada, com cada encadeamento processando um intervalo exclusivo de dados. No entanto, essa não é uma estratégia que o otimizador considera nativamente. Como está, o modelo original do SQL Server para paralelismo quebra a consulta nas trocas e executa os segmentos do plano formados por essas divisões em vários encadeamentos.

    Existem maneiras de conseguir a execução de planos de consulta inteiros em vários encadeamentos em intervalos de conjuntos de dados exclusivos, mas eles exigem truques com os quais nem todos ficarão satisfeitos (e não terão suporte da Microsoft ou garantia de funcionamento no futuro). Uma dessas abordagens é iterar sobre as partições de uma tabela particionada e dar a cada thread a tarefa de produzir um subtotal. O resultado é a SUMcontagem de linhas retornada por cada thread independente:

    Obter números de partição é bastante fácil a partir de metadados:

    DECLARE @P AS TABLE
    (
        partition_number integer PRIMARY KEY
    );
    
    INSERT @P (partition_number)
    SELECT
        p.partition_number
    FROM sys.partitions AS p 
    WHERE 
        p.[object_id] = OBJECT_ID(N'test_transaction_properties', N'U')
        AND p.index_id = 1;
    

    Em seguida, usamos esses números para conduzir uma junção correlacionada ( APPLY) e a $PARTITIONfunção para limitar cada thread ao número de partição atual:

    SELECT
        row_count = SUM(Subtotals.cnt)
    FROM @P AS p
    CROSS APPLY
    (
        SELECT
            cnt = COUNT_BIG(*)
        FROM dbo.test_transaction_item_detail AS i
        JOIN dbo.test_transaction_properties AS t ON
            t.transactionID = i.transactionID
        WHERE 
            $PARTITION.pf_test_transactionId(t.transactionID) = p.partition_number
            AND $PARTITION.pf_test_transactionId(i.transactionID) = p.partition_number
    ) AS SubTotals;
    

    O plano de consulta mostra uma MERGEjunção sendo executada para cada linha na tabela @P. As propriedades de varredura de índice clusterizado confirmam que apenas uma única partição é processada em cada iteração:

    Aplicar plano de série

    Infelizmente, isso resulta apenas em processamento serial sequencial de partições. No conjunto de dados que você forneceu, meu laptop de 4 núcleos (hiperthreaded para 8) retorna o resultado correto em 7 segundos com todos os dados na memória.

    Para que os MERGEsubplanos sejam executados simultaneamente, precisamos de um plano paralelo em que os IDs de partição sejam distribuídos pelos encadeamentos disponíveis ( MAXDOP) e cada MERGEsubplano seja executado em um único encadeamento usando os dados em uma partição. Infelizmente, o otimizador frequentemente decide contra o paralelo MERGEpor motivos de custo e não há nenhuma maneira documentada de forçar um plano paralelo. Existe uma maneira não documentada (e sem suporte), usando o sinalizador de rastreamento 8649 :

    SELECT
        row_count = SUM(Subtotals.cnt)
    FROM @P AS p
    CROSS APPLY
    (
        SELECT
            cnt = COUNT_BIG(*)
        FROM dbo.test_transaction_item_detail AS i
        JOIN dbo.test_transaction_properties AS t ON
            t.transactionID = i.transactionID
        WHERE 
            $PARTITION.pf_test_transactionId(t.transactionID) = p.partition_number
            AND $PARTITION.pf_test_transactionId(i.transactionID) = p.partition_number
    ) AS SubTotals
    OPTION (QUERYTRACEON 8649);
    

    Agora, o plano de consulta mostra os números de partição @Psendo distribuídos entre os encadeamentos em uma base de rodízio. Cada thread executa o lado interno da união de loops aninhados para uma única partição, alcançando nosso objetivo de processar dados disjuntos simultaneamente. O mesmo resultado agora é retornado em 3 segundos em meus 8 hipernúcleos, com todos os oito em 100% de utilização.

    APLICAÇÃO PARALELA

    Não estou recomendando que você use essa técnica necessariamente - veja meus avisos anteriores - mas ela aborda sua pergunta.

    Consulte meu artigo Melhorando o desempenho da junção de tabelas particionadas para obter mais detalhes.

    Columnstore

    Visto que você está usando o SQL Server 2012 (e supondo que seja Enterprise), você também tem a opção de usar um índice columnstore. Isso mostra o potencial de junções de hash no modo de lote onde há memória suficiente disponível:

    CREATE NONCLUSTERED COLUMNSTORE INDEX cs 
    ON dbo.test_transaction_properties (transactionID);
    
    CREATE NONCLUSTERED COLUMNSTORE INDEX cs 
    ON dbo.test_transaction_item_detail (transactionID);
    

    Com esses índices em vigor, a consulta...

    SELECT
        COUNT_BIG(*)
    FROM dbo.test_transaction_properties AS ttp
    JOIN dbo.test_transaction_item_detail AS ttid ON
        ttid.transactionID = ttp.transactionID;
    

    ...resulta no seguinte plano de execução do otimizador sem nenhum truque:

    Plano de armazenamento de colunas 1

    Resultados corretos em 2 segundos , mas eliminar o processamento em modo de linha para o agregado escalar ajuda ainda mais:

    SELECT
        COUNT_BIG(*)
    FROM dbo.test_transaction_properties AS ttp
    JOIN dbo.test_transaction_item_detail AS ttid ON
        ttid.transactionID = ttp.transactionID
    GROUP BY
        ttp.transactionID % 1;
    

    Armazenamento de coluna otimizado

    A consulta de armazenamento de colunas otimizada é executada em 851 ms .

    Geoff Patterson criou o relatório de bug Partition Wise Joins , mas foi fechado como Won't Fix.

    • 19
  2. podiluska
    2012-08-10T01:52:11+08:002012-08-10T01:52:11+08:00

    A maneira de fazer o otimizador funcionar da maneira que você pensa melhor é por meio de dicas de consulta.

    Nesse caso,OPTION (MERGE JOIN)

    Ou você pode ir até o fim e usarUSE PLAN

    • 0

relate perguntas

  • Qual é a diferença entre um INNER JOIN e um OUTER JOIN?

  • Quando devo usar uma restrição exclusiva em vez de um índice exclusivo?

  • Quais são as principais causas de deadlocks e podem ser evitadas?

  • Como é a saída de uma instrução JOIN?

  • Como determinar se um Índice é necessário ou necessário

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    Como ver a lista de bancos de dados no Oracle?

    • 8 respostas
  • Marko Smith

    Quão grande deve ser o mysql innodb_buffer_pool_size?

    • 4 respostas
  • Marko Smith

    Listar todas as colunas de uma tabela especificada

    • 5 respostas
  • Marko Smith

    restaurar a tabela do arquivo .frm e .ibd?

    • 10 respostas
  • Marko Smith

    Como usar o sqlplus para se conectar a um banco de dados Oracle localizado em outro host sem modificar meu próprio tnsnames.ora

    • 4 respostas
  • Marko Smith

    Como você mysqldump tabela (s) específica (s)?

    • 4 respostas
  • Marko Smith

    Como selecionar a primeira linha de cada grupo?

    • 6 respostas
  • Marko Smith

    Listar os privilégios do banco de dados usando o psql

    • 10 respostas
  • Marko Smith

    Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL?

    • 4 respostas
  • Marko Smith

    Como faço para listar todos os bancos de dados e tabelas usando o psql?

    • 7 respostas
  • Martin Hope
    Mike Walsh Por que o log de transações continua crescendo ou fica sem espaço? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland Listar todas as colunas de uma tabela especificada 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney O MySQL pode realizar consultas razoavelmente em bilhões de linhas? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx Como posso monitorar o andamento de uma importação de um arquivo .sql grande? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison Como você mysqldump tabela (s) específica (s)? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    pedrosanta Listar os privilégios do banco de dados usando o psql 2011-08-04 11:01:21 +0800 CST
  • Martin Hope
    Jonas Como posso cronometrar consultas SQL usando psql? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas Como inserir valores em uma tabela de uma consulta de seleção no PostgreSQL? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas Como faço para listar todos os bancos de dados e tabelas usando o psql? 2011-02-18 00:45:49 +0800 CST
  • Martin Hope
    bernd_k Quando devo usar uma restrição exclusiva em vez de um índice exclusivo? 2011-01-05 02:32:27 +0800 CST

Hot tag

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve