我们运行一个小型企业网络,其中包含一些 Windows 服务器和 Backup Exec + 一个 LTO4 磁带库来备份它们。我们使用每年、每月、每周的轮换表,磁带会在异地进行。我还应该提到我们使用 LTO 条形码。
我的问题真的是这个 - 你围绕备份轮换使用什么文书工作/电子表格/数据库/等来实现如下目标:
a) 确保有一份书面的问责记录表明工程师已经检查了备份日志以确保工作成功完成,磁带处于良好状态等(除此之外,这似乎是鼓励该过程的好方法如果人们必须签署他们的名字以表明他们已经做到了,请遵循)。
b) 能够跟踪所有磁带当前的存储位置(Backup Exec 对此有所帮助,但单独的记录似乎是明智的)。如果该记录以某种方式存储在异地,以便在发生办公室火灾等灾难时可以访问,那也很好。
c) 在灾难恢复的情况下,不仅仅是异地存储的磁带,还有一份书面记录,准确解释磁带对应的工作,以及一份显示工作成功完成的记录等。
d) 其他重要的事情
简而言之,审计跟踪。设计的审计跟踪是一种能够抵御办公室火灾等灾难情况的方式。
人们倾向于推出自己的解决方案,还是有现成的解决方案?您倾向于将所有内容都保留在纸上,还是有一些电子方法?您是否保留了场外磁带的任何文书工作?
我应该说我们已经有了一个基本的系统,但我很想知道什么构成了一个好的审计跟踪系统,希望我能改进我们的系统。
非常感谢!
Backup Exec 有一个称为“存储”的功能来跟踪发送到场外的磁带。
a) 似乎更像是一种官僚主义的勾选练习。
b) 你有两个或三个磁带所在位置的记录:你的异地存储供应商的报告;备份执行/库;可能还有您自己的列表/电子表格/数据库。
每次磁带轮换后的一项任务必须是协调这些。这应该由计算机完成:将所有记录输入文件(以某种通用格式)并让计算机对它们进行比较。在一张纸上勾掉磁带 ID 太容易出错了。
c) 似乎毫无意义。在 DR 情况下,您需要能够快速重新创建备份安装,因此您需要详细的(经过测试和演练的)说明,以及磁带和磁盘上的目录备份(至少每天一次)。
确保有适当的(且可访问的)记录说明谁有权从异地存储中召回磁带。如果他们在需要时都在度假会怎样?
(a) 很重要,但不应将其留作人类的流程问题。以适当的周期检查所有这些事情是否正在发生,应该是您的监控系统的功能之一。
(b) 是备份软件的工作。回想一下“一个数据,一个位置”的原则;如果您的备份软件说磁带在一个地方,而您的其他内部程序说它在另一个地方,您会相信谁?如果您的现场/非现场请求是自动生成的(它们应该是),那么保留这些请求的(软)副本会很有帮助;它们始终可以用作备份软件内存的紧急回退检查。
(c) 也是备份软件的工作。任何好的软件包都会内置“裸机还原”的概念,并且应该包括备份服务器本身的裸机还原。我首选的备份软件 bacula在其文档中对此进行了详细说明,该文档假设除了一叠异地备份磁带外,所有东西都已丢失,并且您已获得替换硬件。它说明了你将使用什么工具来索引磁带,如何找到最近的目录备份,如何将其恢复到一个新的、空的 bacula 实例中,以及你将如何从那里恢复客户端。
确保您的备份软件也记录了这一点。 测试程序是否有效。保留这些测试的笔记。
至于 (d),我认为您已经涵盖了大部分要点。我要重申的是,您应该经常测试恢复;不仅每六个月一次,而且至少每月一次。随机挑选一名员工,询问他们最不想丢失的文件;检查本次能否恢复到他们满意的程度。随便问一个 IT 人员,他们最不想失去哪台服务器;将它恢复到另一个盒子并让他们检查它的功能。每六到十二个月全面测试一次灾难恢复程序。是的,这都是成本;很多时间以及异地回拨费用。但是未经测试的备份和程序可能毫无价值,当然也不能依赖。