使用存储过程处理数据与在检索后将其输入函数相比是否有性能提升？

Question

RayofCommand

Asked: 2017-01-17 01:48:43 +0800 CST2017-01-17 01:48:43 +0800 CST 2017-01-17 01:48:43 +0800 CST

当我有 6 个核心并且它们进行表扫描并在之后合并时，每个核心都会扫描整个表吗？

772

我记得我曾经在一张表上丢失了一个索引，并且一个查询需要很长时间。在执行计划中，我看到完成了表扫描和合并。来自 IO 的统计数据显示每个核心都进行了一次表扫描，或者更好的是我进行了 6 次表扫描。现在我想知道是每个核心都进行全扫描，还是每个核心都粗略地进行 1/6 表扫描？我确信如果我有一个合适的索引，我要么只进行一次查找，要么将它拆分为每个核心。

我希望你能理解我在这里的意思，不幸的是我无法提供任何信息，因为这个问题刚刚出现，我的问题在几年前就已经解决了。

1 个回答

Voted

Joe Obbish · Answer 1 · 2017-01-17T17:41:56+08:00

坦率地说，我不太确定“合并已完成”是什么意思。你在谈论合并连接吗？也许你的意思是并行运算符？至少我可以回答有关并行表扫描的问题。

来自 IO 的统计数据显示每个核心都进行了一次表扫描，或者更好的是我进行了 6 次表扫描。

我假设你的意思是你SET STATISTICS IO ON在运行查询之前运行并且部分输出包含如下内容：

表“你的表”。扫描计数 6，...

“扫描计数”标签有点误导。如果报告 6 次扫描，您不应该得出结论，即STATISTICS IO表中的所有行都被扫描了 6 次。考虑以下对名为的堆表的简单示例查询heap_table：

SELECT TOP 1 *
FROM heap_table
OPTION (MAXDOP 1);

对于该查询，STATISTICS IO应该报告扫描计数为 1，对吗？但是 SQL Server 显然不需要读取表中的所有行。查看扫描计数标签的定义也很有帮助：

在任何方向到达叶级别后开始的搜索/扫描次数，以检索所有值以构建输出的最终数据集。

...

扫描计数为 N，当 N 是在使用索引键定位键值后在叶级别向左侧或右侧开始的不同搜索/扫描的数量。

因此，如果您的查询进行了并行扫描，我希望看到的扫描计数至少为 6，但这并不一定意味着表中的所有行都被读取了六次。你怎么知道这些行是如何分布在你的 CPU 核心之间的？

最简单的方法是只看一个实际的执行计划。如果您查看并行扫描的详细信息，SQL Server 将显示每个 CPU 线程处理了多少行。下面是一张您可能会从 Paul White 的文章并行执行计划 – 分支和线程中看到的图片：

正如您所说，您多年前遇到过此查询，因此该方法对您没有帮助。相反，我们需要查看 SQL Server 可用于并行计划处理的技术。Craig Freedman 有一系列关于这个主题的博客文章。来自并行扫描文章：

并行扫描如何工作？

构成并行扫描的线程协同工作以扫描表中的所有行。没有针对特定线程的先验分配或行或页。相反，存储引擎动态地将页面分发给线程。并行页面供应商协调对表页面的访问。并行页面供应商确保每个页面都分配给一个线程，因此只处理一次。

那么，你有它。正如我之前所说，您可以通过使用并行扫描运行查询并检查实际执行计划中并行扫描运算符的详细信息来轻松测试它。

从另一种角度来看，请尝试考虑一个场景，在该场景中，SQL Server 对每个核心进行全表扫描是有益的。

假设您碰巧有一个UNION ALL查询引用了您的表六次。原则上，SQL Server 可以独立地用一个内核进行每个表扫描，最后合并结果。但是，SQL Server 不会这样做，因为它不会进行管道并行处理。即使可以，我个人也想不出在这里这样做有什么好处，除了避免一些与并行相关的开销。

您可能会阅读广播类型的并行执行，并想知道在那种情况下 SQL Server 是否可以对表进行六次完整扫描，每个内核一次。对于广播类型的交换，SQL Server 将所有行发送到所有消费者线程。然而，这可以通过对表进行串行扫描，然后进行分布式流类型的并行交换来实现。事实上，这就是您在散列连接示例中看到的。我真的想不出并行扫描有什么好处，尤其是当广播类型只用于相对较小的表时。

我认为可能会发生这种情况的一种情况是，如果您有一个并行嵌套循环连接，其中包含一个包含 6 行的外部表，并且在连接的内侧进行了表扫描。在那种情况下，我相信表扫描将由独立的串行线程完成，因此您可以有效地让每个核心执行自己的表扫描。当然，这样的查询可能执行得非常差并且不是目标，尤其是当外表超过六行时。

当我有 6 个核心并且它们进行表扫描并在之后合并时，每个核心都会扫描整个表吗？

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

当我有 6 个核心并且它们进行表扫描并在之后合并时，每个核心都会扫描整个表吗？

1 个回答

相关问题