我正在运行 WRF 天气模型。这是一个 ram 密集型、高度并行的应用程序。
我需要为此构建一个 HPC 集群。我使用 10GB infiniband 互连。
WRF 不依赖于核心数,而是依赖于内存带宽。这就是为什么酷睿 i7 3820 或 3930K 比高级至强 E5-2600 或 E7 性能更好的原因
似乎大学将至强 E5-2670 用于 WRF。它的成本约为1500美元。Spec2006 fp_rates WRF 基准显示 580 美元的 i7 3930K 与 1600MHz RAM 的性能相同。
有趣的是,i7 可以处理高达 2400MHz 的内存,大大提高了 WRF 的性能。然后它真的胜过至强。耗电量稍高,但每年仍不到 20 欧元。即使包括我需要的额外部件(PSU、infiniband、外壳),i7 方式仍然比 Xeon 便宜 700 €/cpu。
那么,可以在 HPC 集群中使用“游戏玩家”硬件吗?还是我应该用 xeon 做它?
(这不是关键应用程序。我可以处理停机时间。我想我不需要 ECC?)
我们在高频金融交易领域做了一段时间(考虑到我正在使用的应用程序架构,与 HPC 非常接近)......
大约在 2010 年初,我正在部署带有10GbE Solarflare(带有OpenOnload UDP 消息内核旁路)和/或 Infiniband 互连的定制 3U 机架式单插槽 i7“游戏系统” 。
我没有 IPMI/带外管理,没有电源管理,没有单电源,也没有热插拔部件。我们在不同点同时使用了 SSD 和内部 SAS 磁盘,但磁盘对于计算节点并不重要。操作系统是 Fedora Linux,具有高度定制和优化的内核。
这在概念验证中起作用,并且一直持续到我们对我们的交易应用程序如何在生产中对实时数据做出反应有所了解。然而,随着事情的发展,这变成了管理上的噩梦……
诸如冷却、数据中心热量/空间/密度(这些东西是 3U 盒子)、支持和远程管理等问题最终让这些努力付诸东流。虽然 CPU 在技术上从未出现过故障,但其他所有组件都有问题!. 而且这是在日常生产使用中只有 8 小时的周期......
我们做了什么长期的?
我们放弃了游戏玩家 PC,转而使用合适的专用服务器硬件。是的,这是一家金融公司,所以我们没有预算限制,但考虑到未经验证的应用程序的潜在规模,我仍然需要注意定价。在所有价格范围内都有不错的服务器,如果您打算扩大规模,可以与制造商达成交易。您认为大型 HPC 研究实验室集群不会为设备支付零售价,对吗?我们也没有...
所以,如果你想这样做,请考虑大局。如果您只是考虑在其他服务器级硬件中使用桌面级 CPU,它会起作用……但我不建议全职使用它。
如果您知道涉及此的 CPU 限制和可用性问题,那么我只能提供一个数据点供您考虑。
i7 不能使用 ECC 缓冲内存,也不能安装在双路或四路配置中。这似乎是不使用它的充分理由 - 但当然,您的需求可能另有规定。
就我个人而言,我仍然倾向于 Xeon,因为它旨在在更长的时间内支持更多的并发负载。如果您长时间运行 CPU 密集型工作,比如数小时或数周,Xeon 的平均故障时间比 i7 长得多。
除此之外,我遵从@MDMarra 对服务器加载的回应。
这听起来像每个核心的 CPU 功率并不像你可以塞进一个盒子的核心数量和 RAM 数量那样重要,以便更快地扩展。考虑到这一点,也许您想看看在双 CPU 配置中使用16核皓龙。这可能不适用于 DDR3-2400,但您可以将 256GB 的 DDR3-1600 分布在这 32 个 cpu 内核上。