我做了一些简单的性能测试,似乎从我的 RAID1 读取比写入慢:
root@dss0:~# for i in 1 2 3; do dd if=/dev/zero of=/dev/sda bs=1048576 count=131072; done
137438953472 bytes (137 GB) copied, 192.349 s, 715 MB/s
137438953472 bytes (137 GB) copied, 192.851 s, 713 MB/s
137438953472 bytes (137 GB) copied, 193.026 s, 712 MB/s
root@dss0:~# for i in 1 2 3; do dd if=/dev/sda of=/dev/null bs=1048576 count=131072; done
137438953472 bytes (137 GB) copied, 257.201 s, 534 MB/s
137438953472 bytes (137 GB) copied, 255.522 s, 538 MB/s
137438953472 bytes (137 GB) copied, 259.945 s, 529 MB/s
我明白 dd 不是性能测试工具,但是这个结果仍然是一个惊喜。
系统由供应商构建,具有 16 GByte RAM 的 Supermicro 主板。RAID 控制器是具有 1 GB 高速缓存的 MegaRAID 9271-8i。SAS-933EL1 背板上有 8 个 2 TB SAS 磁盘。我不确定布线,控制器的一个连接器连接到 SAS 背板,另一个连接到两个保存操作系统的 SATA 磁盘。
RAID1 是使用以下命令设置的:
root@dss0:~# /opt/MegaRAID/MegaCli/MegaCli64 -CfgLdAdd -r1 [8:0,8:1,8:2,8:3,8:4,8:5,8:6,8:7] WB NORA Direct -a0
Adapter 0: Created VD 0
Adapter 0: Configured the Adapter!!
Exit Code: 0x00
root@dss0:~# /opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -LALL -aALL
Adapter 0 -- Virtual Drive Information:
Virtual Drive: 0 (Target Id: 0)
Name :
RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0
Size : 7.275 TB
Sector Size : 512
Is VD emulated : No
Mirror Data : 7.275 TB
State : Optimal
Strip Size : 256 KB
Number Of Drives : 8
Span Depth : 1
Default Cache Policy: WriteBack, ReadAheadNone, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteBack, ReadAheadNone, Direct, No Write Cache if Bad BBU
Default Access Policy: Read/Write
Current Access Policy: Read/Write
Disk Cache Policy : Disk's Default
Encryption Type : None
PI type: No PI
Is VD Cached: No
Exit Code: 0x00
我希望读取访问至少与写入访问一样快,甚至可能更快。715 MByte/sec 的写入速度似乎接近单个 SAS/SATA 连接器的 6 GBit 限制。这可能是 SAS 背板的配置或布线问题吗?SAS背板配置可以用MegaRAID命令查询吗?请指教。
更新
正如 poige 和 Peter 所解释的,读取性能低于预期可能是由于 Linux I/O 子系统的缓存造成的。
在 dd 命令中使用直接标志时,我得到
root@dss0:~# dd if=/dev/sda of=/dev/null bs=1048576 count=131072 iflag=direct
137438953472 bytes (137 GB) copied, 199.862 s, 688 MB/s
这要好得多,但仍然比写入速度慢 10%。使用 oflag=direct 不会影响写入速度。
答案的关键是预读。曾几何时,我也碰巧有这个问题。
IOW,为了获得最佳的顺序读取性能,所有磁盘都应永久包含在输入中。
当您使用
dd
w/odirectio
(参见 参考资料man dd
)时,写入操作不会立即执行,而是通过 OS 缓存,因此它有更多机会依次涉及所有磁盘并获得最大可能的性能。poige 关于写缓存的说法完全正确,但这里有更多细节。
dd 带零并使用写缓存不是基准测试的正确方法(当然,除非您想测试写缓存,这可能仅对文件系统有用,以查看它同步元数据、创建新文件等的多少。 )(并且可能 dd 总是错误的基准测试类型,但它适用于非常基本的测试)
我建议您将 dd 与以下选项中的至少一个一起使用:
也不要使用零。如果数据如此可预测为零,则某些智能硬件/软件/固件可能会使用一些快捷方式。如果我猜您没有使用压缩,则尤其如此。相反,使用内存中的随机文件(例如 /dev/shm)。urandom 很慢,所以你需要暂时将它写在某个地方才能再次阅读。创建一个 50MB 的随机文件:
读取文件多次写入(这里我使用cat读取6次):
另请记住,raid1 读取在并行操作中最快,因此可以独立使用磁盘。协调磁盘以使用不同磁盘读取同一操作的不同部分可能不够聪明。