我希望有人能指出我正确的方向 - 看起来我对这个主题没有足够的知识,而且时间框架太紧,我无法深入探索不同的场景。
我们有两个相距几英里的数据中心,通过 100 Mbps 链路连接。每个数据中心将有 5 个 BL490 刀片,ESX 标准托管大约 50 个虚拟机。每个站点都有 HP eva4400 SAN,并设置了 SAN 复制。VC 将位于第一个数据中心,并且两个数据中心都联网。
SAN 复制是块级的,所以看起来我不能只复制更改,而是必须复制所有写入。这应该不是问题,因为链接每天可以维持大约 1.8 TB 并且可以缓冲数据。
但是我很难想象在这种情况下恢复将如何工作。我们不需要即时恢复,我会说 4 小时的恢复时间是可以接受的,因此由于财务原因,不容易接受像 DR 场景这样的花哨的自动 SRM,但是欢迎任何意见。
目前的思路是:将 LUN 从主站点复制到辅助站点。当灾难发生时,IT 人员打开远程端的 ESX 主机并将复制的 LUN 连接到它们,然后注册 VM 并更改 IP 地址。
我知道这似乎是一个可怕的手动过程,我几乎可以肯定我在这里错过了一些明显的陷阱。
有人可以让我知道我应该去哪个方向吗?关于这个主题的文章?
这是一个全新的设置,我们宁愿建立基本的恢复过程并在以后扩展它。我只需要有一个正确的方向来实现这种可扩展性。
非常感谢您!
谢尔盖,
我们目前正在工作中进行类似的设计。虽然不是 HP SAN 的,但请查看此站点。您可能需要投资于 VCenter(以前称为 Virtual Center),您可以在其中注册主机并为 VM 执行 HA。由于您的复制是块级的,因此虚拟机可以共享存储集群以实现冗余。
谢尔盖,
我们用两个 EVA 8000 做类似的事情,除了我们的彼此相距半英里并且通过光纤连接。如果您有热备用 ESX 服务器,那么每次在 EVA 上创建新的源 LUN 时,它们也会同时出现在备用 ESX 服务器上。默认情况下,它们将没有读写访问权限,直到故障转移。每次执行此操作或至少偶尔一次,您都需要重新扫描 ESX 服务器中的 HBA 以选择新的 LUN。在灾难中,您需要做的就是对 LUN 进行故障转移并重新注册 VM。不明白为什么需要更改 IP 地址。肯定只有一套会在任何时候。此外,如果您可以偶尔测试一次并注册虚拟机,那么该步骤也将被删除。
整个过程可以在几分钟而不是几小时内完成。