据我所知,(大多数)文件系统不支持多次写入文件系统集群。换句话说,集群是文件系统中的最小单元,即使需要写入一点信息,也需要使用新的集群。但是,它与 RAID 块相似吗?如果 RAID 块比文件系统集群大几倍,是否可以将文件系统集群附加到 RAID 块中?
用于解释问题的绘图:
据我所知,(大多数)文件系统不支持多次写入文件系统集群。换句话说,集群是文件系统中的最小单元,即使需要写入一点信息,也需要使用新的集群。但是,它与 RAID 块相似吗?如果 RAID 块比文件系统集群大几倍,是否可以将文件系统集群附加到 RAID 块中?
用于解释问题的绘图:
对于大多数文件系统,您的第一个陈述是不正确的,尽管有像 ZFS 这样的明显例外,它们确实在某种
Copy on Write
模式下工作。(编辑:再读一遍,我不确定我是否理解你的第一句话。你的意思是一条新信息,也就是一个新文件,总是需要一个完整的新块,这对于大多数文件系统来说确实如此,再次与一些例外,因为 ZFS 和 btrfs 等现代文件系统非常复杂,并且使用可变块大小等功能。)。
RAID 通常无法在这种模式下工作,因为它们不知道阵列的哪些部分是空闲的,因此对 RAID 设备的给定逻辑块的每个写入操作都必须转到同一个 RAID 块。同样,ZFS 和类似的文件系统在这里是不同的,因为它们是 RAID 和文件系统的组合。
最后一点:SSD 总是在 Copy-On-Write 模式下工作,因为它们的工作方式:更新给定块中的任何内容,即使是一位,都需要擦除该块并再次写入,这种擦除操作非常慢。相反,SSD 控制器会制作一个新副本并在空闲时擦除该块。如果 SSD 用完 COW 的空块,SSD 会变得缓慢而无法使用。
第二次编辑,回应您的编辑/澄清:
重要的是要了解 Linux 软件 RAID(或就此而言的硬件 RAID)没有文件或文件系统的概念,它只处理块设备,并且基本上根据某些将逻辑卷中的块映射到物理介质块规则。如果 RAID 块大于最小的文件系统分配块,则完全有可能来自两个或多个文件的数据最终位于该块中,因为 RAID 驱动程序所看到的只是将一条数据写入某个逻辑块的请求无论该数据的内容如何,它都会根据其规则将其写入物理介质。它甚至没有办法(也没有必要)确定这条数据是否以任何方式与该块中的其他数据相关。不用说,ZFS/btrfs 的工作方式不同 :)