我在 dmesg 中有垃圾邮件,其中包含:
kernel:EDAC MC0: UE page 0x0, offset 0x0, grain 1073741824, row 3, labels ":": i3200 UE
知道什么是错的吗?
这里是加载的模块:
# lsmod | grep edac
i3200_edac 3330 0
edac_core 46581 2 i3200_edac
edac-util 没有显示任何错误
# edac-util -v
mc0: 0 Uncorrected Errors with no DIMM info
mc0: 0 Corrected Errors with no DIMM info
mc0: csrow0: 0 Uncorrected Errors
mc0: csrow0: ch0: 0 Corrected Errors
mc0: csrow0: ch1: 0 Corrected Errors
mc0: csrow1: 0 Uncorrected Errors
mc0: csrow1: ch0: 0 Corrected Errors
mc0: csrow1: ch1: 0 Corrected Errors
mc0: csrow2: 0 Uncorrected Errors
mc0: csrow2: ch0: 0 Corrected Errors
mc0: csrow2: ch1: 0 Corrected Errors
mc0: csrow3: 0 Uncorrected Errors
mc0: csrow3: ch0: 0 Corrected Errors
mc0: csrow3: ch1: 0 Corrected Errors
mc0: csrow4: 0 Uncorrected Errors
mc0: csrow4: ch0: 0 Corrected Errors
mc0: csrow4: ch1: 0 Corrected Errors
mc0: csrow5: 0 Uncorrected Errors
mc0: csrow5: ch0: 0 Corrected Errors
mc0: csrow5: ch1: 0 Corrected Errors
mc0: csrow6: 0 Uncorrected Errors
mc0: csrow6: ch0: 0 Corrected Errors
mc0: csrow6: ch1: 0 Corrected Errors
mc0: csrow7: 0 Uncorrected Errors
mc0: csrow7: ch0: 0 Corrected Errors
mc0: csrow7: ch1: 0 Corrected Errors
这似乎是一个内存错误,但不是致命的。
将阻止控制台上的垃圾邮件,直到下次重新启动。
基本上 ce_errors 是可纠正错误的缩写(也就是 ram 外没有“缺陷”)。
有关更多详细信息,请参阅 关于 edac 和 edac wiki 的内核文档。
虽然我可能完全错了,但我们有一个带有这个(ECC RAM)的服务器,并且由于没有不可纠正的错误并且 memdisk 没有显示任何问题,要么我让它使用相同的 ram 运行,更改输出,开始监控不可纠正的错误和我们没有进一步的问题。