我有一个运行 3 个硬盘的 RAID 的 FreeBSD。我面临监控其 RAID 的挑战 - 如果硬盘出现故障或出现一些我需要知道的问题。
所以,我现在做的第一件事是尝试了解 SmartCTL 的工作原理……我目前使用的命令是:
smartctl --scan -j - To scan my devices and generated a JSON Structured list.
smartctl -i /dev/device_name - To list informations about a single device
smartctl -a /dev/your-device - More information like errors and etc (I think i can use this in some way to grep only errors sections...)
SmartCTL 是否还有其他参数可以检查磁盘是否可写、是否处于活动状态以及其健康状态是否正常?
这个理解的主要目的是主要使用 SmartCTL 来生成数据,这些数据将用于 pfSense RAID Monitoring with Low Level Discovery for Zabbix Monitoring Software 的模板中......
任何帮助都将不胜感激。
smartctl --isDiskOK /dev/sda
好的,所以回答 -据我所知,您没有办法采取任何措施。最接近的 smartctl 可以带您到这是重新分配扇区计数的报告。我不打算详细解释,但基本上当磁盘开始出现故障时,难以读/写的扇区将被重新定位到备用扇区。如果发生更多的重新分配,则意味着驱动器更接近完全死机。
使用以下项目创建 zabbix 模板:
允许用户 zabbix 通过 sudoers 执行 smartctl:
将模板分配给受监控的主机 + 重新启动 zabbix_agent 以加载配置 - 您的项目应该填充重新分配的扇区数
利润.. :)
无论如何,zabbix 模板也可以在我的 GitHub 上找到https://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf
请享用。