Temos 254 servidores físicos quando todas as máquinas são servidores DELL R740.
servidores fazem parte do cluster Hadoop. a maioria deles está mantendo o sistema de arquivos HDFS e os serviços de gerenciamento de nó e nó de dados, parte deles são máquinas Kafka.
O sistema operacional instalado nos servidores físicos é o RHEL 7.9
Agora queremos adicionar 52 servidores físicos adicionais ao cluster. mas podemos adicionar apenas os servidores DELL R760
que devem ser instalados comRHEL 8.6
cada servidor físico inclui 256G e 64 núcleos.
O problema é que não podemos trabalhar com a versão RHEL 8.6 porque a versão Hadoop. não cabe RHEL 8.6
Portanto, precisamos ficar com a versão RHEL 7.9, mas, por outro lado, o servidor DELL R760 não pode estar alinhado com o RHEL 7.9
portanto, estamos pensando em usar máquinas VM em vez de máquinas físicas DELL R760.
está claro para nós que o desempenho da VM não é como o das máquinas físicas.
mas digamos. se aumentarmos a memória padrão de 256G para 384G e aumentarmos os COREs de 64 para 80 Core's, na(s) máquina(s) VM
Portanto, caso definamos a máquina VM como acima da especificação com mais memória e CPU
então faz sentido adicionar as máquinas VM adicionais? ao cluster Hadoop e não se preocupar com problemas de desempenho?
Nota obrigatória: eu trabalho para a Dell
O comentário de @HBrujin já basicamente respondeu à pergunta e é suficientemente completo que vale a pena repetir:
^ é o que eu faria.
O que acrescentarei é que frequentemente trabalho com clientes de HPC e, em algum momento, você precisa morder a bala. O RHEL 7 já tem uma década e é basicamente EOL (tecnicamente tem alguma manutenção mínima até junho próximo, quando você estará completamente sozinho) . Trabalhando em HPC, aprecio totalmente o esforço necessário para atualizar, mas se você está no ponto de comprar um novo hardware de compatibilidade com versões anteriores, impedir a execução de tudo em VMs só se tornará cada vez mais complicado. O NVMe não se comporta muito bem em alguns casos, surgiram problemas de BIOS, o suporte ao driver está cada vez mais duvidoso, já vi todo tipo de coisa começar a quebrar em nossos servidores Gen 15, muito menos Gen 16 (o que você tem).
Se ainda não houver um, recomendo criar um plano de migração para uma versão mais recente do RHEL.