在这里跟进我的其他问题,我想要一种简单的方法来形象化答案。
我试过使用这样的查询,但“正在运行”的线程数有时会超过 DOP。
SELECT ost.session_id,
ost.exec_context_id,
ost.scheduler_id,
qp.node_id,
w.worker_address,
qp.physical_operator_name,
ost.task_state,
qp.row_count
FROM sys.dm_os_tasks AS ost
JOIN sys.dm_os_workers AS w
ON ost.worker_address = w.worker_address
LEFT JOIN sys.dm_exec_query_profiles AS qp
ON w.task_address = qp.task_address
WHERE ost.session_id = 57
AND ost.task_state = 'RUNNING'
ORDER BY ost.exec_context_id, ost.scheduler_id, qp.node_id, w.worker_address;
我也尝试过使用query_thread_profile
扩展事件,但对于具有多个并行分支的计划,它显示相同的 N 个线程 ID。这似乎与给出的答案相反,因为 DOP 没有明确限制使用的线程总数。对于以 DOP 4 运行的查询,它看起来像这样。我确信相同的四个线程(加上协调器)不会用于所有分支和操作员。
因此,在 DOP 8 运行这样的查询会为我提供三个并行分支。
SELECT COUNT(DISTINCT t1.Data)
FROM dbo.t1
JOIN dbo.t2
ON t1.Id = t2.f_Id
JOIN t3
ON t1.Id = t3.f_Id
OPTION(FORCE ORDER, HASH JOIN);
但有时我的查询返回这个:
有时它返回这个:
这是一些示例数据:
CREATE TABLE dbo.t1 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, Data INT NOT NULL );
CREATE TABLE dbo.t2 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, f_Id INT NOT NULL );
CREATE TABLE dbo.t3 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, f_Id INT NOT NULL );
INSERT dbo.t1 WITH (TABLOCKX) ( Data )
SELECT ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) % 2000
FROM (
SELECT TOP 1000000 1 AS num
FROM master..spt_values AS sv
CROSS JOIN master..spt_values AS sv2
CROSS JOIN master..spt_values AS sv3
) AS nums
INSERT dbo.t2 WITH (TABLOCKX) ( f_Id )
SELECT TOP 15000000 t.Id
FROM dbo.t1 AS t
CROSS JOIN dbo.t1 AS t2
INSERT dbo.t3 WITH (TABLOCKX) ( f_Id )
SELECT TOP 25000000 t.Id
FROM dbo.t1 AS t
CROSS JOIN dbo.t1 AS t2
谢谢!
从
dm_os_tasks
到的连接dm_os_workers
是一对一的,因为工作线程只运行一个任务。从 tasks/workers 到的连接dm_exec_query_profiles
是一对多的,因为每个线程可能运行多个计划节点。您需要查看与状态关联的唯一任务/执行上下文/调度程序的数量:
RUNNING
此调试通道事件的扩展事件描述不准确:
的文档
sys.dm_exec_query_profiles
更好地描述了thread_id
:在每个分支中,每个线程都有一个 ID,类似于 showplan 中的每个线程细分。在 DOP x 处,每个分支都有从 1 到 x 的线程 ID,但它只是一个序列号(想想行号)。
您可以通过收集任务/工作线程/系统线程 ID 来区分扩展事件中的线程。如果您对整个执行计划的线程 ID 感兴趣,最好的代理是
execution_context_id
. 每个执行上下文都与一个线程相关联。可视化
并行执行的可视化可以通过许多不同的方式来完成,这取决于所调查的特定方面。可以通过多种方式加入和订购 DMV。
例如,下面显示了每个线程最近做了什么,以及它当前正在等待什么(如果有的话):
演示查询的示例输出: