我们需要专门用于 HPC Lustre 故障转移设置的存储,其中两台服务器必须共享相同的块级存储才能进行故障转移配置。
由于对硬件的了解非常有限,我有以下理解:
- NAS可用于共享存储,但由于中间网络会存在速度瓶颈。
- 可以使用 SAN,但实施该解决方案的成本很高,而且对于 50-100TB 的存储来说并不是真正需要的。
- 如果我们发现存储机箱有多个iscsi端口,则只能通过拆分来使用存储,即作为两个存储设备工作,并且两个系统不能使用相同的存储
。(这里要提醒一件事,在 luster 设置中,两台服务器都只会连接,但只会使用一个(不确定,如何可能,再次需要检查)。 - 拥有两个虚拟机可能是我们可以做到的。但是,它对于故障转移的目的并没有真正的帮助,因为物理机只是一台。
但是,在发布问题时,我在想,如果我们尝试让一台直接连接的服务器(主服务器)和另一台通过网络连接的服务器(故障转移),我们可能会在 NAS 的速度上妥协,所以我们只有在主服务器时才会遇到缓慢停止工作。
迈克尔是说光泽不在乎。你所需要的只是一个出现在 /dev 中的块设备。
您仍然需要注意其他层,例如网络。如果您的网络链接比您的磁盘慢,您将失去性能。这很可能是以太网的情况。即使使用快速链接,您也会使用 iscsi 而不是直接附加丢失少量。很难真正猜出您的问题是什么,因为它取决于您的硬件。我认为这就是为什么很难获得或给出明确答案的原因(我已经看到你的光泽讨论帖子,但我认为这是一个更普遍地与硬件和互连相关的问题)。
肖恩
“如果我们发现存储机箱有多个 iSCSI 端口,则只能通过拆分来使用存储,即,作为两个存储设备工作,并且两个系统不能使用相同的存储。” 不是真的,您可以与多台机器共享 iSCSI(或任何其他块设备)LUN,但您需要使用具有某种形式的分布式锁定机制的集群感知文件系统。幸运的是,这些很容易找到,但很少是任何操作系统的默认设置
如果您想要的只是在两个主机之间共享的一堆共享磁盘,那么我建议您查看类似 HPE MSA2040 SAS 磁盘系统的东西。顾名思义,它是 SAS,但它设置为允许两台服务器连接到它,并且两台服务器都可以看到您在盒子上设置的各种逻辑磁盘。这样,在一台服务器摔倒另一台服务器的情况下,仍然可以看到相同的磁盘。您可以使用 OCFS2、GFS 和一些其他文件系统来设置它——当与集群服务一起使用时,甚至是带有 Server 2012/R2 的 NTFS。除非您想使用 FC/FCoE/iSCSI 等,否则这几乎是最便宜的方法。