我们有一个服务器,RAID 1 磁盘正在尝试重建或同步。磁盘正在重新同步,但服务器已无响应。一个人不能 ssh 进入盒子,也没有任何服务响应。如果您在本地局域网上,您可以通过 ssh 登录,但速度极慢,无法使用。
什么可能导致这个问题?我们最近用新磁盘重建了大约一个月前出现故障的机器。无论如何,我们需要增加磁盘大小,所以借此机会这样做。现在我不确定是否存在某种硬件故障。它们是使用软件raid 的sata 磁盘。
通常,如果一个磁盘或控制器发生故障,则第二个磁盘继续运行。不知道现在发生了什么。
任何帮助表示赞赏。
您的重新同步速度对于您的磁盘 IO 功能来说太高了。运行
echo 1000 >/proc/sys/dev/raid/speed_limit_max
,您应该会看到快速恢复响应。一旦得到控制,请将速度限制调整到适合您的硬件的水平。可能是您的分区未正确对齐。我有一个带有两个分区未对齐的 WD1000EARS 磁盘的系统。它有你同样的问题。我对磁盘进行了重新分区,使用 parted 创建分区并检查对齐。重建速度跃升至 60-70MB/s,系统反应灵敏。与之前的情况相比,负载明显降低,等待 i/o cpu 负载非常低。