Cyker Asked: 2019-01-14 22:44:53 +0800 CST2019-01-14 22:44:53 +0800 CST 2019-01-14 22:44:53 +0800 CST Linux 上文件缓存的最佳块大小是多少? 772 设备块大小通常为 512 字节,而文件系统块大小通常为 4096 字节。为什么它们不同?为什么 512B 和 4KB 是设备和文件系统块大小的好选择?什么块大小最适合在用户空间库中缓存磁盘读取? filesystems cache 1 个回答 Voted Best Answer peterh 2019-01-14T23:06:39+08:002019-01-14T23:06:39+08:00 设备块大小是系统与 HDD 控制器通信的块大小。如果你想读/写硬盘,它会发生这样的事情: 读: CPU -> 硬盘控制器:“请将块 43623626 的数据发送给我” 硬盘控制器 -> CPU:“完成,这里是:0xfce2c0deebed...” 写: CPU -> 硬盘控制器:“请将此数据写入块 3452345:0xfce2c0deebed...” 硬盘控制器-> CPU:“完成” 这里的块号表示第 2354242 个 512 字节块的名称。 理论上,可以使用任何块大小。大多数设备使用 512 字节块,其中一些,特别是大型 HDD 使用 4096 字节块。一些光学介质使用 2304 字节块。 重要的是:块设备控制器不知道它上面的文件系统的任何内容。它只能在其块大小中读取和写入块到他的介质。这就是块设备驱动程序用来为内核提供块设备的东西:本质上是一个单一的大字节数组。没关系,它是如何分区的或哪个 fs 正在使用它。 文件系统块大小是文件系统数据结构在文件系统中组织的块大小。它是文件系统的内部特性,甚至不需要使用面向块的数据结构,有些文件系统甚至不这样做。 Ext4 使用最典型的 4096 字节块。 此外,磁盘 IO 数据通常不是由进程直接处理,而是由操作系统的虚拟内存处理。它广泛使用分页。VM 页面大小通常为 4096 字节(在非 x86 CPU 上可能不同),由 CPU 架构决定。(例如,较新的 amd64 CPU 可以处理 2MB 页面,或 dec alpha 使用 8192 字节页面)。 优化数据IO,最好都是相乘,相等更好。这通常意味着:使用 4096 字节的 fs 块。 这也很重要:如果您的块设备已分区,则分区应该以精确的页面大小开始/结束。如果您不这样做,例如您的 sda1 从 sda 的 17. 块开始,CPU 将不得不为所有页面读/写操作发出两个读/写命令,因为物理块和文件系统块将重叠. 在最常见的情况下,这意味着:所有分区都应从可被 8 整除的扇区开始或开始(4096 / 512 = 8)。 请注意,通常低级块 IO 不会发生在单个块读/写操作中,而是在单个命令中发送/接收多个块。并且重新组织数据通常不是很大的开销,因为内存 IO 通常比块设备 IO 快得多。因此,不遵循这些不会是一个很大的开销。
设备块大小是系统与 HDD 控制器通信的块大小。如果你想读/写硬盘,它会发生这样的事情:
读:
写:
这里的块号表示第 2354242 个 512 字节块的名称。
理论上,可以使用任何块大小。大多数设备使用 512 字节块,其中一些,特别是大型 HDD 使用 4096 字节块。一些光学介质使用 2304 字节块。
重要的是:块设备控制器不知道它上面的文件系统的任何内容。它只能在其块大小中读取和写入块到他的介质。这就是块设备驱动程序用来为内核提供块设备的东西:本质上是一个单一的大字节数组。没关系,它是如何分区的或哪个 fs 正在使用它。
文件系统块大小是文件系统数据结构在文件系统中组织的块大小。它是文件系统的内部特性,甚至不需要使用面向块的数据结构,有些文件系统甚至不这样做。
Ext4 使用最典型的 4096 字节块。
此外,磁盘 IO 数据通常不是由进程直接处理,而是由操作系统的虚拟内存处理。它广泛使用分页。VM 页面大小通常为 4096 字节(在非 x86 CPU 上可能不同),由 CPU 架构决定。(例如,较新的 amd64 CPU 可以处理 2MB 页面,或 dec alpha 使用 8192 字节页面)。
优化数据IO,最好都是相乘,相等更好。这通常意味着:使用 4096 字节的 fs 块。
这也很重要:如果您的块设备已分区,则分区应该以精确的页面大小开始/结束。如果您不这样做,例如您的 sda1 从 sda 的 17. 块开始,CPU 将不得不为所有页面读/写操作发出两个读/写命令,因为物理块和文件系统块将重叠.
在最常见的情况下,这意味着:所有分区都应从可被 8 整除的扇区开始或开始(4096 / 512 = 8)。
请注意,通常低级块 IO 不会发生在单个块读/写操作中,而是在单个命令中发送/接收多个块。并且重新组织数据通常不是很大的开销,因为内存 IO 通常比块设备 IO 快得多。因此,不遵循这些不会是一个很大的开销。