我们有 254 台物理服务器,所有机器都是 DELL 服务器 R740。
服务器是 Hadoop 集群的一部分。其中大多数拥有HDFS文件系统和数据节点和节点管理器服务,其中一部分是Kafka机器。
物理服务器上安装的操作系统是RHEL 7.9
现在我们要向集群添加额外的 52 台物理服务器。但我们只能添加R760
必须安装的DELL 服务器RHEL 8.6
每台物理服务器包括256G和64个核心。
问题是我们无法使用 RHEL 8.6 版本,因为 Hadoop 版本。不适合 RHEL 8.6
因此,我们需要保留 RHEL 7.9 版本,但另一方面 DELL 服务器 R760 无法与 RHEL 7.9 保持一致
所以,我们正在考虑使用VM机器而不是DELL R760物理机。
我们很清楚虚拟机的性能与物理机的性能不同。
但我们可以这么说。如果我们将虚拟机上的默认内存从 256G 增加到 384G,并将核心数从 64 增加到 80 个核心
因此,如果我们将 VM 机器设置为具有更多内存和 CPU 的上述规格
那么添加额外的虚拟机有意义吗?到Hadoop集群而不担心性能问题?
必填备注:我在戴尔工作
@HBrujin 的评论已经基本上回答了问题,并且足够彻底,值得重复:
^这就是我会做的。
我要补充的是,我经常与 HPC 客户合作,在某些时候您需要咬紧牙关。RHEL 7 已经有十年历史了,基本上已经停产(从技术上讲,它只有一些最低限度的维护,直到明年 6 月,届时您就完全靠自己了)。在 HPC 工作中,我完全理解升级所需的努力,但如果您正在购买新的硬件,向后兼容性禁止在虚拟机中运行所有内容只会变得越来越麻烦。NVMe 在某些情况下表现不太正常,出现了 BIOS 问题,驱动程序支持越来越不稳定,我已经看到各种各样的事情在我们的 Gen 15 服务器上开始出现问题,更不用说 Gen 16(你拥有的)了。
如果尚未到位,我强烈建议您创建一个迁移到较新版本 RHEL 的计划。