我一直在使用 rsnapshot 非常成功地备份了一些服务器,并且对它比较满意,除了一个主要问题:监控。
对于那些使用 rsnapshot 的人,你如何监控它?我想要一些方法来验证 rsnapshot 是否正在运行,它正在拉下文件,并且通常它正在以应有的方式工作。如果不是,我应该立即收到电子邮件,以便我可以修复故障。
显然,这不能替代恢复文件的常规测试,这就是我过去发现问题的方式。我只是希望将一些更自动化的东西添加到我的测试方案中,以便可以更快地发现和纠正其中的一些错误。
你用什么来监控rsnapshot?或者,您的备份监控策略一般是什么?
除了日志扫描,还可以执行稍微自动化的检查。
例如,我有一个脚本,它在几个文件区域及其各自的备份之间执行“rsync -a --dry-run”,并将结果通过电子邮件发送给我。它每周通过 cron 运行,或者我有时手动运行它。预计会有小的差异,因为自上次每日备份以来通常会发生变化,但显着差异会显示某些问题。
同样对于我的邮件服务器(运行 Zimbra 的 F/OSS 版本的 VM),我有一个 VM 副本,它偶尔会删除其邮件存储并恢复主服务器的最新备份。我每周进行的一项手动检查是登录“备份测试”虚拟机,并确保它运行正常并具有它应具有的所有最新更改。我也可以为此手动启动测试过程。
将它添加到logcheck之类的工具中,总结它引发的任何问题将是一个好的开始。