dmesg
这是来自重要生产服务器(RHEL 7.2 - DELL 机器硬件)的输出示例,因为我们可以看到sde
服务器中的磁盘快死了
[Wed Jun 30 11:24:58 2021] sd 0:2:4:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Wed Jun 30 11:26:18 2021] sd 0:2:4:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Wed Jun 30 11:26:18 2021] sd 0:2:4:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Wed Jun 30 11:27:28 2021] sd 0:2:4:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Wed Jun 30 11:27:46 2021] sd 0:2:4:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
有趣的是,这些消息是旧的2021
,我们没有在2022/2023
基于这些事实,我想问一下是否应该根据来自的错误磁盘消息考虑更换磁盘2021
第二个重要问题是如何通过以下方式捕获新的内核消息dmesg
是否可以重新创建新的内核消息?
据我所知,也许重启机器可以帮助解决这个问题,但我想避免机器重启
dmesg
默认情况下打印来自内核环形缓冲区的消息。环形缓冲区是一种特殊类型的缓冲区,它始终保持恒定大小,在收到新消息时删除最旧的消息,它在系统启动时重新实例化,因此您看到的已经是可用的最新内核消息。
今天当您看到大约两年前的消息时,结合旧版RHEL 7.2,首先想到的是:您将近两年没有执行任何重新启动,并且似乎没有对该服务器进行任何维护甚至更长!
如果您的服务器确实是从 2015 年末到 2026 年初(RHEL 版本建议的),那么我会首先检查您的备份的完整性、您的还原过程和灾难恢复计划,并可能开始计划更换和升级.
如果您想检查实时系统上的磁盘健康状况:您可以尝试读取 SMART 数据和/或启动智能自检
smartctl
要查看各种支持的自检需要多长时间的估计:
例如开始一个简短的测试: