lofidevops Asked: 2018-05-22 04:59:31 +0800 CST2018-05-22 04:59:31 +0800 CST 2018-05-22 04:59:31 +0800 CST 如何检查系统运行状况? 772 我想要一份关于我的系统健康状况的报告,以便我知道我的所有硬件组件(CPU、内存、磁盘...)都按预期运行。如果报告只列出发现的问题(如果有的话),那将是最容易阅读的。有没有系统工具可以做到这一点? 相关说明: 我知道磁盘实用程序可以报告我的磁盘的 SMART 结果。我希望我的所有其他组件都有类似的东西。 原始诊断工具和基准不适合。诊断工具列出组件详细信息,但不列出其运行状况。基准有时只会突出健康问题。我只对直接的健康报告感兴趣。 我知道在 Windows 中执行此功能的等效工具(报告硬件组件是否出现故障),但我忘记了名称:P 我基本上想要一个等效的工具。 software-recommendation hardware hardware-test 1 个回答 Voted Best Answer WinEunuuchs2Unix 2018-05-22T05:37:40+08:002018-05-22T05:37:40+08:00 电子设备通常可以 100% 或 0% 工作。根据您已经知道的SMART报告,硬盘驱动器等机械设备确实具有即将发生故障的迹象。 粉丝 风扇具有即将发生的故障指示器,但这是基于您的听力和对诸如摆动速度、尖叫轴承等指标的聆听。 中央处理器 风扇退化的另一个潜在指标是 CPU 热量水平。在笔记本电脑上意味着风扇排气口堵塞或 RPM 太低。这也可能意味着 CPU / 主板需要用压缩空气清洁灰尘(不要使用含有水分的呼吸)。这也可能意味着您的 CPU 散热器需要用新的导热膏重新安装。 内存 如果您的机器锁定并显示错误的内存错误,您可以按照以下说明测试您的 RAM:如何通过 linux 检查 RAM 中的错误?. 如果 RAM 检查器发现坏内存块,您可以使用以下说明将其列入黑名单:有没有办法限制内核的内存管理器只使用 75% 的内存? NVMe PCIe M.2 Gen 3.0 x 4(或 2)SSD 如果您有 SSD,则它们的使用寿命以数万亿次写入来衡量。您的SMART实用程序已测量 SSD 寿命,但不适用于 NVMe SSD。为此,您需要nvme-cli. 要安装它,请使用: sudo apt install nvme-cli 接下来从 SSD 收集可用信息: $ sudo nvme smart-log /dev/nvme0 Smart Log for NVME device:nvme0 namespace-id:ffffffff critical_warning : 0 temperature : 40 C available_spare : 100% available_spare_threshold : 10% percentage_used : 0% data_units_read : 12,539,332 data_units_written : 10,623,582 host_read_commands : 281,194,884 host_write_commands : 96,528,713 controller_busy_time : 672 power_cycles : 1,677 power_on_hours : 687 unsafe_shutdowns : 105 media_errors : 0 num_err_log_entries : 279 Warning Temperature Time : 0 Critical Composite Temperature Time : 0 Temperature Sensor 1 : 40 C Temperature Sensor 2 : 51 C Temperature Sensor 3 : 0 C Temperature Sensor 4 : 0 C Temperature Sensor 5 : 0 C Temperature Sensor 6 : 0 C Temperature Sensor 7 : 0 C Temperature Sensor 8 : 0 C 最重要的字段Percentage used显示为 0%。这不是磁盘使用百分比,而是生命使用百分比。该驱动器是在 2017 年 10 月购买的,它仍然是0%在 2018 年 12 月。2020Percentage used年 10 月达到 1%。按照这个速度,NVMe SSD 的寿命将是 300 年。当然,在那之前它会过时...... 桌面上的系统监视器conky 许多人喜欢在桌面的一部分上显示他们的系统状态(和运行状况)。我喜欢让我的 Conky 在主显示器的右侧 20% 上运行: 注意:单 CPU 上 97% 的 CPU 使用率是由屏幕录像机本身造成的。 要了解有关conkyCPU 使用情况的更多信息,请参阅:如何(同时)对 CPU 和 RAM 进行压力测试?
电子设备通常可以 100% 或 0% 工作。根据您已经知道的SMART报告,硬盘驱动器等机械设备确实具有即将发生故障的迹象。
粉丝
风扇具有即将发生的故障指示器,但这是基于您的听力和对诸如摆动速度、尖叫轴承等指标的聆听。
中央处理器
风扇退化的另一个潜在指标是 CPU 热量水平。在笔记本电脑上意味着风扇排气口堵塞或 RPM 太低。这也可能意味着 CPU / 主板需要用压缩空气清洁灰尘(不要使用含有水分的呼吸)。这也可能意味着您的 CPU 散热器需要用新的导热膏重新安装。
内存
如果您的机器锁定并显示错误的内存错误,您可以按照以下说明测试您的 RAM:如何通过 linux 检查 RAM 中的错误?.
如果 RAM 检查器发现坏内存块,您可以使用以下说明将其列入黑名单:有没有办法限制内核的内存管理器只使用 75% 的内存?
NVMe PCIe M.2 Gen 3.0 x 4(或 2)SSD
如果您有 SSD,则它们的使用寿命以数万亿次写入来衡量。您的SMART实用程序已测量 SSD 寿命,但不适用于 NVMe SSD。为此,您需要
nvme-cli
. 要安装它,请使用:接下来从 SSD 收集可用信息:
最重要的字段
Percentage used
显示为 0%。这不是磁盘使用百分比,而是生命使用百分比。该驱动器是在 2017 年 10 月购买的,它仍然是0%
在 2018 年 12 月。2020Percentage used
年 10 月达到 1%。按照这个速度,NVMe SSD 的寿命将是 300 年。当然,在那之前它会过时......桌面上的系统监视器
conky
许多人喜欢在桌面的一部分上显示他们的系统状态(和运行状况)。我喜欢让我的 Conky 在主显示器的右侧 20% 上运行:
注意:单 CPU 上 97% 的 CPU 使用率是由屏幕录像机本身造成的。
要了解有关
conky
CPU 使用情况的更多信息,请参阅:如何(同时)对 CPU 和 RAM 进行压力测试?