是否有任何 MySQL 基准测试工具？[关闭]

Question

Mate Michelisz

Asked: 2021-06-22 00:15:35 +0800 CST2021-06-22 00:15:35 +0800 CST 2021-06-22 00:15:35 +0800 CST

为什么数据库的默认页面大小如此之小？

772

在 PostgreSQL 和 SQL Server 中，默认页面大小为 8 KB，在 MySQL 中为 16 KB，在 IBM DB2 和 Oracle 中仅为 4 KB。

为什么这些页面尺寸这么小？

是否有历史或内存使用原因？

3 个回答

Voted

Vérace · Answer 1 · 2021-06-22T04:53:18+08:00

我正在运行 Linux（Fedora 34、64 位、两个内核、四个 CPU、32 GB RAM - PostgreSQL 13.3）。

如果我运行stat -f some_random_file如下：

[pol@fedora inst]$ stat -f blah.txt
  File: "blah.txt"
    ID: f1b798b1610e7067 Namelen: 255     Type: ext2/ext3
Block size: 4096       Fundamental block size: 4096
Blocks: Total: 322411548  Free: 316122834  Available: 299727775
Inodes: Total: 81960960   Free: 81739842
[pol@fedora inst]$

注意：Block size: 4096= 4096 字节 = 32768 位。

现在，即使您有一个长度为两个字节的文件"Hi"（操作系统将磁盘上的内容作为 4K“块”取出，然后以 4K 块的形式返回 - 请参阅此处以获取快速概览。您可能想在自己的系统上进行测试。

磁盘本身有自己的“原子”单元。对于 HDD，这通常是 512 字节，但请参见上面的链接 - “在硬件级别，旧驱动器使用 512B 扇区，而新设备通常以更大的块（通常为 4kB 甚至 8kB）写入数据”。有关HDD，请参见此处，有关 SSD ，请参见此处。（感谢@RonJohn 的评论）。

同样，数据库将以块的形式读取和读取数据（也称为页面 - 术语可能会令人困惑） - 如果您更改记录中的一个单独的位，数据库仍然必须读取记录所在的整个页面并写入修改完成后将整个页面放回磁盘。

在 PostgreSQL 上，您有 8K 的默认块大小。

test_1=# SELECT name, setting, short_desc, extra_desc FROM pg_settings WHERE name like '%block%' or short_desc LIKE '%block%';

      name      | setting |                  short_desc                  | extra_desc
----------------+---------+----------------------------------------------+------------
 block_size     | 8192    | Shows the size of a disk block.              |
 wal_block_size | 8192    | Shows the block size in the write ahead log. |
(2 rows)

test_1=#

重要的是 HDD、操作系统和 RDBMS“原子单元”大小之间没有太大的差距 - 否则，你会冒着撕裂页面的风险- 从链接：

避免破损的页面

对于 Postgres 文件布局，Postgres 一次将数据读取和写入磁盘 8kb。大多数操作系统使用较小的页面大小，例如 4kb。如果 Postgres 在其中一个操作系统上运行，可能会出现一个有趣的边缘情况。由于 Postgres 以 8kb 为单位写入磁盘，而操作系统以 4kb 为单位写入磁盘，因此如果电源在正确的时间断电，则 Postgres 正在执行的 8kb 写入可能只有 4kb 被写入磁盘。这种边缘情况有时被称为“撕裂的页面”。Postgres 确实有一种解决破损页面的方法，但它确实增加了 Postgres 需要执行的 I/O 量。

另外，请参见此处：

部分写入/撕裂页面

那么整页写的是什么？正如 postgresql.conf 中的评论所说，这是一种从部分页面写入中恢复的方法——PostgreSQL 使用 8kB 页面（默认情况下），但堆栈的其他部分使用不同的块大小。Linux 文件系统通常使用 4kB 页面（可以使用更小的页面，但在 x86 上最大为 4kB），在硬件级别上，旧驱动器使用 512B 扇区，而新设备通常以更大的块写入数据（通常为 4kB 甚至 8kB） .

因此，当 PostgreSQL 写入 8kB 页面时，存储堆栈的其他层可能会将其分成更小的块，单独管理。这提出了关于写入原子性的问题。8kB 的 PostgreSQL 页面可以分成两个 4kB 的文件系统页面，然后分成 512B 扇区。现在，如果服务器崩溃（电源故障、内核错误……）怎么办？

与许多与计算机科学相关的东西一样，这是一个权衡和妥协的问题——这里是 PostgreSQL 在相同系统上运行的基准，只是改变了块大小——来自帖子：

Samsung SSD 840, 500 GB                          TPS (txns/second)

blocksize=2k                                     147.9
blocksize=4k                                     141.7
blocksize=8k                                     133.9
blocksize=16k                                    127.2
blocksize=1MB                                     42.5

因此，您可以看到一个天真的“使 db 块大小尽可能大”的方法效果不佳。关于这一点我要说的是，数据库基准测试完全是一个泥潭……对于某些应用程序来说，1 MB可能很合适——尽管超出 16 KB 需要相当大的理由。系统的默认参数就是 -默认值- 在最广泛的情况下选择得相当好......

回覆。问题的历史部分 - 是的，很多都与磁盘进入 512 字节扇区时的历史有关...... HDD，尽管速度有所提高，锈蚀成分的逐步改进，但自第一个 HDD 以来基本上没有变化 - HDD 的性能已经远远落后于 CPU 和 RAM...容量增加了，但速度没有那么多（见这里）——因此“NoSQL”潮流运动的诞生（但那是另一天的工作:-)）！

这几天，这个地区发生了很多事情......

如果你有兴趣 - 并且有时间 - 我已经仔细阅读了几次，但它比我的工资等级略高......这里有一篇关于Linux I/O 的文章以及它是如何被 io_uring 彻底改变的（参见wiki - 以及其中的链接）。

英特尔还提供了一个开源工具包，即SPDK（存储性能开发工具包），它似乎（至少在我未经训练的人看来）是某种允许用户空间进程直接访问硬件而无需通过内核的方式。 .这是关于如何将其应用于数据库的有趣观点。

而且，同样出现在现场的是（8）字节可寻址存储......由于硬件设计人员最熟悉的原因，SSD（至少其中一些）也有块和页面......它们不是灵丹妙药（检查出 TLC SSD 和普通 HDD 写入速度 - 只有 30% 的增益）。

然而，在（远？）地平线上，有持久记忆——来自帖子：

8 字节原子性

持久性内存（例如英特尔傲腾 DC 持久性内存）本机按字节运行，而不是像传统存储那样在数据块中运行。数据在 Persistent Memory 中最多保留为 8 字节的块（同样，使用默认行为）。对于基于 BLOCK 结构的应用程序（如数据库），持久内存的 8 字节原子性可能是一个问题。写入 8,192 字节的数据（一个 8K 块）将被持久化为 1,024 个 8 字节的块。电源故障或其他异常情况可能会使数据块“破碎”或“撕裂”成碎片，其中部分数据块包含旧数据，而其他部分包含新数据。需要更改应用程序（例如数据库）以容忍这种类型的块破裂或撕裂。否则，这些是有效损坏的数据块。

因此，我们可以看到这些系统仍然会出现诸如撕裂页面之类的问题- 但它们确实提供了可能性 - 当数据库程序员赶上时 - 块大小 = 8 字节（而不是8 KB） - 您想要更改BIGINT 的值，你所要做的就是读 8 个字节，写 8 个字节...

也许如果我们下降到这个级别，或者甚至是单个字节的特异性，那么对于磁盘、操作系统和 RDBMS，页面的整个概念就会消失？我确信仍然会有文件系统——只是不确定它们将如何工作。

这是一个引人入胜的领域（问题+1！），尤其是对于数据库极客。

Ronaldo · Answer 2 · 2021-06-22T03:39:13+08:00

我将根据我使用 SQL Server 的经验来回答，尽管我相信原因可能与您提到的其他 RDBMS 相同。

如果您查看Pages and Extents Architecture Guide文档，您会发现：

磁盘 I/O 操作在页面级别执行。也就是说，SQL Server 读取或写入整个数据页。

这意味着当您请求数据时，它将按页而不是按行加载到内存中。考虑到这一点，将以下图像视为页面的表示：

一个页面可以包含空白空间，如果默认大小是 1Gb 来容纳每页更多的数据，一个新页面将有近 1Gb 的空白空间，并且只需要一些空间来快速分配您的服务器内存空间。

与内存相关的另一点是，只要您可以将页面保留在内存中（SQL Server 中的 Page Life Expectancy (PLE)），您就不必在每次请求数据时都花时间将其从磁盘读取到内存中。如果服务器内存被少量页面快速消耗，则将更频繁地从内存中清除每个页面以分配新请求的页面，以便 SQL Server 可以使用它们。

Microsoft SQL Server 查询数据的基本原理是将必要的数据页从磁盘加载到缓冲池中，然后返回给客户端。如果缓冲区没有足够的空间来处理它，那么最旧的数据页将被删除，以便为新页腾出一些空间。

这些是您所说的页面很小的基本原因。

J.D. · Answer 3 · 2021-06-22T03:38:17+08:00

在这种情况下，小是一个主观的术语。数据库中的Page Size设置越大，存储到Page的数据就越多，因此在需要从磁盘加载给定 Page 的任何时候都需要加载更多的数据。您可以将页面视为数据在磁盘上物理存储方式的度量单位，而磁盘通常是服务器最慢的硬件组件。

例如，如果您运行的查询只需要返回 4 KB 的数据，但您的 Page Size 设置为 1 GB，这意味着您需要等待整个 1 GB 的数据从磁盘加载出来才能提供服务4 KB 的数据。很可能，这在性能方面不会很好。

此外，这只是假设您的 4 KB 数据连续存储在同一页面上，这将取决于您的数据和查询的谓词。例如，如果您的数据分布在 4 个页面上，那么现在需要从磁盘加载 4 GB 的数据才能仅提供 4 KB 的数据。

作为参考，对于单个整数或日期时间列，4 KB 的数据大约是 1,000 行。因此，即使我们谈论的是一个 10 列宽且平均数据大小为整数数据类型的数据集，这仍然是 4 KB 可以容纳的 100 行数据。

因此，选择的页面大小不要太大，以免浪费的 I/O 用于从磁盘加载比服务查询所需的更多数据，但相反也不能太小，否则可能会由于增加而遇到性能瓶颈为少量数据加载许多页面所需的操作数。4 KB 到 16 KB 在数据库中一直处于合理的范围内，这就是为什么它是默认的。如果您发现您的数据库工作负载和用例支持更改它，您可以随时调整它，但通常不需要更改。

为什么数据库的默认页面大小如此之小？

避免破损的页面

部分写入/撕裂页面

8 字节原子性

连接到 PostgreSQL 服务器：致命：主机没有 pg_hba.conf 条目

如何让sqlplus的输出出现在一行中？

选择具有最大日期或最晚日期的日期

如何列出 PostgreSQL 中的所有模式？

列出指定表的所有列

如何在不修改我自己的 tnsnames.ora 的情况下使用 sqlplus 连接到位于另一台主机上的 Oracle 数据库

你如何mysqldump特定的表？

使用 psql 列出数据库权限

如何从 PostgreSQL 中的选择查询中将值插入表中？

如何使用 psql 列出所有数据库和表？

为什么数据库的默认页面大小如此之小？

3 个回答

避免破损的页面

部分写入/撕裂页面

8 字节原子性

相关问题