之后:修复递归故障,但在 x3850 x6 SLES12 上需要重新启动
问:我在想,如果我在 linux 服务器上遇到内核崩溃,我该如何调试,是什么驱动程序导致了内核崩溃?
就我而言,这似乎是由于emulex
驱动程序问题,因为自从更新该驱动程序以来,内核恐慌不再发生。
有人可以详细说明调查内核恐慌原因的分步推荐过程吗?请包括在哪里保存/如何从内核恐慌中保存核心转储,例如:如果 liveCD 出现恐慌,直到我可以看到哪个驱动程序导致崩溃。
之后:修复递归故障,但在 x3850 x6 SLES12 上需要重新启动
问:我在想,如果我在 linux 服务器上遇到内核崩溃,我该如何调试,是什么驱动程序导致了内核崩溃?
就我而言,这似乎是由于emulex
驱动程序问题,因为自从更新该驱动程序以来,内核恐慌不再发生。
有人可以详细说明调查内核恐慌原因的分步推荐过程吗?请包括在哪里保存/如何从内核恐慌中保存核心转储,例如:如果 liveCD 出现恐慌,直到我可以看到哪个驱动程序导致崩溃。
关于您之前的问题,我将添加
debug
到您的内核 cmdline 以查看更详细的输出。至于从内核崩溃中恢复,我通常启动到livecd并检查日志。对驱动程序进行故障排除的一种简单方法是将您认为可能导致崩溃的驱动程序列入黑名单,向后工作直到系统再次启动(或完全启动),然后单独启用每个驱动程序,直到您的系统再次崩溃。
以下是一些用于调试 linux 内核的其他资源: