我们有 20 多台 Windows 2k3 物理服务器,每周几次用于一些繁重的计算作业。用户通过 rdp 登录到它们并运行一些作业。一旦这些作业完成,用户将结果保存在这些共享服务器上的本地硬盘上. 生成的文件总共可以有几 GB,每个文件的平均大小为 100M。文件准备就绪后,来自 scriptserver 的脚本会连接到每个服务器共享,并将这些服务器上的文件同步到 Celerra NS20 NAS 上的文件共享。同步完成后,文件会从文件管理器发送给客户到 ftp 服务器。
这种设置已经存在多年,现在我们正在虚拟化我们的基础设施,所以我正在考虑摆脱这些服务器并用虚拟机替换它们以节省电力、空间和硬件支持。服务器不需要处于高可用性设置,但它们确实需要大量内存,并且它们运行的应用程序不是多线程的。
当前可以使用的基础设施:
- Dell PowerEdge M600 刀片上的 Vsphere 基础设施。我们可能会再购买 2 个刀片来容纳这些服务器
- CX3-10 光纤通道 SAN。我们可能会购买额外的磁盘托盘来容纳这些服务器。我倾向于说服管理层购买 FC 磁盘。
- Celerra NS20 文件管理器连接到此 SAN 上的 SATA 磁盘托盘
- Cisco Catalyst 3560 千兆交换机
我主要关心的是如何重新组织存储。由于所有服务器都在同一个 SAN 上,所有这些对共享的摆弄都将消失。我正在考虑将驱动器映射到 NAS 文件管理器上的位置,然后将文件同步到同一个位置,但是这似乎是文件管理器上的数据重复。
也许在这种设置中有一种更优雅的方式来重新排列存储并且有人处于类似的情况?
我的计划有什么重大失误吗?我应该期待哪些陷阱?
用两个刀片替换 20 多台执行繁重计算工作的服务器可能没问题,但您确实需要检查并发处理能力的总量是否足够。M600 现在已被 M610 取代 - 这是一个双 Xeon 5500,支持 (IIRC) 高达 96GB 的 RAM。
使用 Xeon 5540 配置,您有 8 个真正的 CPU 内核,每个刀片可以使用大约 40Ghz 的总 CPU 功率,总共 80Ghz。超线程可以为您提供更多,但虚拟化会收回一些。您也许可以再提高 25% 到 5560\5570,这些都是基于 Nehalem EP 的,所以每个 Ghz 都会获得更多的收益。一般来说,将 20 台服务器整合到这种工具包中会很好,但这完全取决于这些数字如何适合您的系统。
我不是 100% 清楚您的存储更改 - 即使在您的重新设计中所有存储都在同一个 SAN 上直接使用虚拟机集群,您仍然必须将它们通过操作系统移动到我所看到的文件管理器中。
请记住,除非您有一个集群文件系统(例如,Linux 或 IRIX 上的 CXFS)支持存储,否则您仍然不能让两台机器共享 LUN。
虽然它可能看起来有效,但会导致大规模的腐败。