Tenho o banco de dados AdventureWorks2014 instalado no meu SQL Server 2014 de teste. Estou planejando executar a seguinte consulta:
SELECT *
FROM Sales.SalesOrderDetail sod
INNER JOIN Production.Product p ON sod.ProductID = p.ProductID
ORDER BY Style
Antes de realmente executá-lo, tenho a seguinte imagem dos meus threads de trabalho:
Durante a execução da consulta, verifiquei novamente o estado dos threads de trabalho:
Como você pode ver, o total de active_workers_count na 2ª imagem é maior do que na 1ª captura de tela. A partir da segunda captura de tela, posso supor que o total de threads de trabalho necessários para a execução da consulta foi 1+2+1+2=6. No entanto, quando dou uma olhada nas propriedades do operador de varredura de índice no meu plano de execução, vejo:
Parece que meu grau de paralelismo era 4, o que significa que 4 threads estavam processando linhas paralelamente.
Estou confuso e não consigo determinar quantos threads estavam sendo executados durante a execução da consulta. Alguém pode me explicar por que active_workers_count é diferente de DOP?
Para entender isso, você realmente precisa olhar para o plano de execução. Aqui está o que recebo para esta consulta no SQL Server 2017 no DOP 4 (no modo de compatibilidade do SQL Server 2014):
Cada ramificação paralela recebe threads DOP. Portanto, à primeira vista, parece que 12 trabalhadores podem estar ativos para essa consulta de uma só vez, no máximo.
No entanto, uma junção de correspondência de hash deve consumir toda a ramificação de entrada de compilação (superior) antes de ativar a ramificação de entrada do probe (inferior). Então, aqui está como a execução vai, geralmente:
Assim, esta consulta usará no máximo 8 threads de trabalho paralelos por vez. O SQL Server é inteligente o suficiente para perceber que apenas duas ramificações podem estar ativas ao mesmo tempo (devido à natureza de bloqueio do Hash Match) e reserva apenas 8 threads (em vez de 12):
Observe que ele diz "2" para ramificações - esse é o número de ramificações que podem ser executadas simultaneamente.
Para resolver sua captura de tela de workers ativos, alguns threads podem terminar todo o trabalho antes de outros (porque têm menos linhas para processar, por exemplo). Portanto, em um determinado ponto da execução da consulta, você pode ter apenas 6 threads em execução (dos 8 threads possíveis).
Leitura relacionada:
Planos de Execução Paralela – Branches e Threads
No SQL Server, o paralelismo é por operador ou outra coisa?
Em uma máquina com quatro processadores, apenas quatro threads podem ser executados por vez. No entanto, você pode ter mais de quatro threads. Eles apenas esperam um pelo outro para concluir as etapas e passam pelos processadores repetidamente até a conclusão. Assim, durante cargas mais pesadas, você verá contagens de fios mais altas do que em cargas mais baixas. No entanto, o número de execução simultânea é limitado pelo Grau Máximo de Paralelismo em seu servidor ou pelo número físico em sua caixa.