AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / dba / 问题 / 205926
Accepted
WorldStar SQL
WorldStar SQL
Asked: 2018-05-06 05:37:13 +0800 CST2018-05-06 05:37:13 +0800 CST 2018-05-06 05:37:13 +0800 CST

在 SQL Server 中可视化并行线程使用情况的最简单和最准确的方法是什么?

  • 772

在这里跟进我的其他问题,我想要一种简单的方法来形象化答案。

我试过使用这样的查询,但“正在运行”的线程数有时会超过 DOP。

SELECT    ost.session_id,
          ost.exec_context_id,
          ost.scheduler_id,
          qp.node_id,
          w.worker_address,
          qp.physical_operator_name,
          ost.task_state,
          qp.row_count
FROM      sys.dm_os_tasks AS ost
JOIN      sys.dm_os_workers AS w
    ON ost.worker_address = w.worker_address
LEFT JOIN sys.dm_exec_query_profiles AS qp
    ON w.task_address = qp.task_address
WHERE     ost.session_id = 57
AND       ost.task_state = 'RUNNING'
ORDER BY  ost.exec_context_id, ost.scheduler_id, qp.node_id, w.worker_address;

我也尝试过使用query_thread_profile扩展事件,但对于具有多个并行分支的计划,它显示相同的 N 个线程 ID。这似乎与给出的答案相反,因为 DOP 没有明确限制使用的线程总数。对于以 DOP 4 运行的查询,它看起来像这样。我确信相同的四个线程(加上协调器)不会用于所有分支和操作员。

xe_session

因此,在 DOP 8 运行这样的查询会为我提供三个并行分支。

SELECT COUNT(DISTINCT t1.Data)
FROM dbo.t1 
JOIN dbo.t2 
ON t1.Id = t2.f_Id
JOIN t3
ON t1.Id = t3.f_Id
OPTION(FORCE ORDER, HASH JOIN);

但有时我的查询返回这个:

查询1

有时它返回这个:

查询_2

这是一些示例数据:

CREATE TABLE dbo.t1 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, Data INT NOT NULL );

CREATE TABLE dbo.t2 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, f_Id INT NOT NULL );

CREATE TABLE dbo.t3 ( Id INT IDENTITY PRIMARY KEY CLUSTERED, f_Id INT NOT NULL );

INSERT dbo.t1 WITH (TABLOCKX) ( Data )
SELECT ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) % 2000
FROM (
SELECT TOP 1000000 1 AS num
FROM master..spt_values AS sv
CROSS JOIN master..spt_values AS sv2
CROSS JOIN master..spt_values AS sv3
) AS nums

INSERT dbo.t2 WITH (TABLOCKX) ( f_Id )
SELECT TOP 15000000 t.Id
FROM dbo.t1 AS t
CROSS JOIN dbo.t1 AS t2

INSERT dbo.t3 WITH (TABLOCKX) ( f_Id )
SELECT TOP 25000000 t.Id
FROM dbo.t1 AS t
CROSS JOIN dbo.t1 AS t2

谢谢!

sql-server parallelism
  • 1 1 个回答
  • 309 Views

1 个回答

  • Voted
  1. Best Answer
    Paul White
    2018-05-07T14:25:32+08:002018-05-07T14:25:32+08:00

    我试过使用这样的查询,但“正在运行”的线程数有时会超过 DOP。

    从dm_os_tasks到的连接dm_os_workers是一对一的,因为工作线程只运行一个任务。从 tasks/workers 到的连接dm_exec_query_profiles是一对多的,因为每个线程可能运行多个计划节点。

    您需要查看与状态关联的唯一任务/执行上下文/调度程序的数量:RUNNING

    SELECT
        COUNT(DISTINCT DOT.scheduler_id)            -- or task_address / exec_context_id
    FROM sys.dm_os_tasks AS DOT
    WHERE
        DOT.task_state = N'RUNNING'
        AND DOT.session_id = 72                     -- specify the session id
        AND DOT.parent_task_address IS NOT NULL;    -- additional workers only
    

    我也尝试过使用query_thread_profile扩展事件,但对于具有多个并行分支的计划,它显示相同的 N 个线程 ID。

    此调试通道事件的扩展事件描述不准确:

    xe描述

    的文档sys.dm_exec_query_profiles更好地描述了thread_id:

    区分属于同一查询运算符节点的线程(对于并行查询)。

    在每个分支中,每个线程都有一个 ID,类似于 showplan 中的每个线程细分。在 DOP x 处,每个分支都有从 1 到 x 的线程 ID,但它只是一个序列号(想想行号)。

    您可以通过收集任务/工作线程/系统线程 ID 来区分扩展事件中的线程。如果您对整个执行计划的线程 ID 感兴趣,最好的代理是execution_context_id. 每个执行上下文都与一个线程相关联。

    可视化

    并行执行的可视化可以通过许多不同的方式来完成,这取决于所调查的特定方面。可以通过多种方式加入和订购 DMV。

    例如,下面显示了每个线程最近做了什么,以及它当前正在等待什么(如果有的话):

    DECLARE @session_id smallint = 72;
    
    SELECT
        DOT.task_state,
        DOT.scheduler_id,
        DOT.exec_context_id,
        DEQP.physical_operator_name,
        DEQP.node_id,
        DEQP.thread_id,
        DEQP.row_count,
        DOWT.wait_duration_ms,
        DOWT.wait_type,
        DOWT.resource_description
    FROM sys.dm_os_tasks AS DOT
    OUTER APPLY
    (
        -- What each thread did most recently
        SELECT * 
        FROM sys.dm_exec_query_profiles AS DEQP
        WHERE
            DEQP.session_id = DOT.session_id
            AND DEQP.request_id = DOT.request_id
            AND DEQP.task_address = DOT.task_address
        ORDER BY
            DEQP.last_active_time DESC
        OFFSET 0 ROWS FETCH FIRST 1 ROW ONLY
    ) AS DEQP
    OUTER APPLY
    (
        -- Longest wait, if any
        SELECT * 
        FROM sys.dm_os_waiting_tasks AS DOWT
        WHERE
            DOWT.session_id = DOT.session_id
            AND DOWT.exec_context_id = DOT.exec_context_id
        ORDER BY
            DOWT.wait_duration_ms DESC
        OFFSET 0 ROWS FETCH FIRST 1 ROW ONLY
    ) AS DOWT
    WHERE
        DOT.session_id = @session_id
        --AND DOT.task_state = N'RUNNING'
    ORDER BY
        DEQP.node_id,
        DOT.exec_context_id;
    

    演示查询的示例输出:

    输出

    • 6

相关问题

  • SQL Server - 使用聚集索引时如何存储数据页

  • 我需要为每种类型的查询使用单独的索引,还是一个多列索引可以工作?

  • 什么时候应该使用唯一约束而不是唯一索引?

  • 死锁的主要原因是什么,可以预防吗?

  • 如何确定是否需要或需要索引

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目

    • 12 个回答
  • Marko Smith

    如何让sqlplus的输出出现在一行中?

    • 3 个回答
  • Marko Smith

    选择具有最大日期或最晚日期的日期

    • 3 个回答
  • Marko Smith

    如何列出 PostgreSQL 中的所有模式?

    • 4 个回答
  • Marko Smith

    列出指定表的所有列

    • 5 个回答
  • Marko Smith

    如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

    • 4 个回答
  • Marko Smith

    你如何mysqldump特定的表?

    • 4 个回答
  • Marko Smith

    使用 psql 列出数据库权限

    • 10 个回答
  • Marko Smith

    如何从 PostgreSQL 中的选择查询中将值插入表中?

    • 4 个回答
  • Marko Smith

    如何使用 psql 列出所有数据库和表?

    • 7 个回答
  • Martin Hope
    Jin 连接到 PostgreSQL 服务器:致命:主机没有 pg_hba.conf 条目 2014-12-02 02:54:58 +0800 CST
  • Martin Hope
    Stéphane 如何列出 PostgreSQL 中的所有模式? 2013-04-16 11:19:16 +0800 CST
  • Martin Hope
    Mike Walsh 为什么事务日志不断增长或空间不足? 2012-12-05 18:11:22 +0800 CST
  • Martin Hope
    Stephane Rolland 列出指定表的所有列 2012-08-14 04:44:44 +0800 CST
  • Martin Hope
    haxney MySQL 能否合理地对数十亿行执行查询? 2012-07-03 11:36:13 +0800 CST
  • Martin Hope
    qazwsx 如何监控大型 .sql 文件的导入进度? 2012-05-03 08:54:41 +0800 CST
  • Martin Hope
    markdorison 你如何mysqldump特定的表? 2011-12-17 12:39:37 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 对 SQL 查询进行计时? 2011-06-04 02:22:54 +0800 CST
  • Martin Hope
    Jonas 如何从 PostgreSQL 中的选择查询中将值插入表中? 2011-05-28 00:33:05 +0800 CST
  • Martin Hope
    Jonas 如何使用 psql 列出所有数据库和表? 2011-02-18 00:45:49 +0800 CST

热门标签

sql-server mysql postgresql sql-server-2014 sql-server-2016 oracle sql-server-2008 database-design query-performance sql-server-2017

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve