是否有人同时使用 Linux 和 Windows 故障转移冗余集群,如果有,您更喜欢文件服务器和/或 Web 服务器中的哪一个?
对于一点背景。我们在 Windows 2000 下建立并管理了一个 Microsoft 集群数年。该集群是一对 Web 服务器,具有相当大的(当时)用于为 Web 提供多媒体存储的 RAID 阵列 - 成千上万的 mp3 商业广告正在服务于广播电台。对于这种情况,我们有很多不喜欢的地方。首先,微软集群使用了共享存储阵列。尽管它是热插拔 RAID,但它所需要的只是驱动器上的 NTFS 文件系统轻微损坏,并且在 ChkDsk 运行时突然之间您关闭了几个小时。
因此,在下一次构建中,我们购买了一款名为 NeverFail 的产品 - http://www.neverfailgroup.com/ 该产品在主服务器和辅助服务器之间自动复制数据,使其在块写入级别保持同步。这消除了我们在共享存储方面遇到的问题。但它也引入了自己的问题。任何重新启动都需要重新同步数据,系统会分析所有内容以进行同步。虽然系统在此同步期间启动并可用,但在 mp3 文件少于 1 TB 的服务器上,这需要几个小时。一个典型的 Microsoft 补丁会话需要几个这样的重新同步。因此,我们通常需要 2 天以上的时间来修补 2 台机器。结果,我们发现自己推迟了打补丁,并且没有像我们应该做的那样频繁地打补丁,这并不理想。而且这个过程很棘手,必须具体遵循。
因此,我们正在考虑将包含所有这些内容的主站点移动到一对带有 Linux HA 和 DRBD 的 LAMP 盒子。
所以我很好奇是否有人有管理 Linux 和 Windows 集群的经验,他们可能会告诉我他们的经历。具体来说,我们想知道重启时的重新同步时间等,以及管理这样一个 Linux 系统的整体经验。
虽然我们传统上是一家 Windows 商店,但我们现在有一个内部了解 Linux 的人,我现在也在学习,并且已经在我们的系统中添加了许多 Linux 机器,因此我们从管理的角度对此持开放态度.
我喜欢 Linux HA 的东西,而 DRBD 现在已经达到了非常棒的水平。在我遇到的情况下,Windows 同类产品从未提供接近相同水平的稳定性和可配置性。
首先是一些观察,我相信其他人会有更多的数据。DRBD 的存在时间比原生的 windows 目录同步工具要长,所以它可能更健壮。其次,Windows 2008 的 DFS/Replication 技术已经过重写,性能更好。它的存在时间不及 DRBD,但它承诺能够在多个服务器之间复制大型目录。DFS/Replication 不像 DRBD 那样在块级别,只是文件/目录级别。使用 DFS/Replication 的完全重新同步是在线的,而不是离线的,因此您不会遇到与 neverfailgroup 相同的服务中断。