我为自己构建了一个基于 linux 的 NAS。它在 LVM 配置中有多个不同大小和使用年限的驱动器,具有 800GB 左右的数据。使用简单的 samba 服务器提供数据。
这是完美的工作,但在物理移动它之后,它出现了一个奇怪的故障:每当我在服务器上做某事导致磁盘活动时,整台机器都会死机。这具有杀死任何与盒子的开放网络连接的效果,并且通常使其无用。
如果我离开机器几分钟,它似乎又会恢复正常,但显然这并不是真正的解决方案。
syslog 或内核日志中没有错误或警告消息。如果我打开机器并离开它,它会运行几天而不会锁定。在那之后,我停止了测试。
它不会立即冻结 - 显然它不会在启动时冻结,我通常可以通过 SSH 登录并在它死之前开始在一些日志文件中查看几分钟。
我的问题是:
我可以运行哪些诊断测试来确定原因?
调试此类问题的典型方法是将调试内核设置为输出到 com 端口。您将另一台计算机连接到该端口并读取日志。这样您就可以了解系统冻结时发生的情况。但这听起来像是某种驱动程序/硬件问题,而且很难调试。