Estou "atualizando" um servidor do CentOS 7 para o Rocky 8. Este servidor é um Supermicro SYS-1029U-TRT 1U, funciona como parte de um HPC e possui duas interfaces de rede Ethernet e uma Infiniband. Uma das interfaces Ethernet é para o HPC, a outra é utilizada para a rede da sala de servidores e acesso à Internet. Depois de abrir uma cópia da VM do servidor CentOS, iniciei uma nova instalação do Rocky 8. Reutilizei a tabela de partições anterior e o RAID mdadm que já estava configurado e formatei cada partição. Após a instalação e configuração inicial das interfaces de rede, o servidor fica excepcionalmente lento ao lidar com qualquer tráfego de rede através da interface "externa". Esse problema nunca foi evidente no CentOS e apresenta vários sintomas.
- As consultas DNS não são concluídas. Isso é visto especialmente bem ao executar um ping em um host na rede local ou ao tentar baixar um arquivo da Internet ou de um servidor web local via curl ou wget.
- Os pings de e para o servidor, usando apenas IP, falharão ou começarão a funcionar depois que alguns pacotes, geralmente cerca de 4, falharem.
- As conexões SSH com o servidor geralmente falham com algumas tentativas de obter uma solicitação de senha, mas o login nunca é concluído.
Tentei várias etapas de solução de problemas sem nenhuma solução aparente ainda.
- Verifiquei se as configurações de IP, tabela de roteamento e resolv.conf estavam corretas.
- Desconectei ambas as interfaces de rede HPC. Também tentei com as interfaces conectadas mas desativadas, sem configuração, e com elas conectadas e configuradas.
- Verifiquei se os drivers Ethernet estavam corretos para o hardware. O sistema inclui duas interfaces Intel X540-AT2 de 10 Gbps que usam o driver ixgbe do kernel. Também baixei e instalei a versão mais recente do driver da Intel.
- Verifiquei se a porta do switch está configurada corretamente, incluindo as configurações de VLAN e MTU.
- Testei as outras duas interfaces via ping de e para o servidor e ambas não apresentaram problemas.
- Desconectei a interface do switch normal e usei um novo cabo para conectá-la a um switch próximo na mesma VLAN.
Nenhuma dessas etapas mudou nada. Estou sem ideias e estou procurando outras razões possíveis para isso estar ocorrendo. Se alguma informação for necessária, terei prazer em adicioná-la conforme solicitado.
Um problema anterior que não foi relatado quando o CentOS 7 foi instalado é que às vezes uma conexão SSH “pausa” por até um minuto antes de ser utilizável novamente. Isso é semelhante aos problemas atuais para me fazer pensar que é um problema de hardware.
Aqui estão algumas saídas de comando ip, ip a e ip route, para mostrar como as coisas estão configuradas. Além disso, ao configurar no nmtui, ativei as configurações "Nunca usar esta rede para rota padrão", "Ignorar rotas obtidas automaticamente" e "Ignorar parâmetros DNS obtidos automaticamente" nas conexões eno2 e ib0. Nenhuma dessas configurações está habilitada na conexão eno1.
[root@hostname ~]# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eno1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP group default qlen 1000
link/ether ac:1f:6b:c9:b3:6e brd ff:ff:ff:ff:ff:ff
altname enp24s0f0
inet 10.0.21.150/22 brd 10.0.23.255 scope global noprefixroute eno1
valid_lft forever preferred_lft forever
3: eno2: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP group default qlen 1000
link/ether ac:1f:6b:c9:b3:6f brd ff:ff:ff:ff:ff:ff
altname enp24s0f1
inet 10.33.0.110/22 brd 10.33.3.255 scope global noprefixroute eno2
valid_lft forever preferred_lft forever
4: ib0: eno2: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 4092 qdisc mq state UP group default qlen 256
link/infiniband 00:00:01:20:fe:80:00:00:00:00:00:00:0c:42:a1:03:00:c0:af:08 brd 00:ff:ff:ff:ff:12:40:1b:ff:ff:00:00:00:00:00:00:ff:ff:ff:ff
inet 10.33.4.110/22 brd 10.33.7.255 scope global noprefixroute ib0
valid_lft forever preferred_lft forever
[root@hostname ~]# ip route
default via 10.0.20.1 dev eno1 proto static metric 100
10.0.20.0/22 dev eno1 proto kernel scope link src 10.0.21.150 metric 100
10.33.0.0/22 dev eno2 proto kernel scope link src 10.33.0.110 metric 101
10.33.4.0/22 dev ib0 proto kernel scope link src 10.33.4.110 metric 150
Edit1: Adicionadas mais informações, o problema do CentOS.
Edit2: Adicionadas saídas de comando ip solicitadas e algumas configurações de nmtui.
Descobriu-se que este é um verdadeiro problema de rede, endereços MAC conflitantes.
Quando criei a cópia da VM, dupliquei o endereço MAC da interface do hardware com a intenção de alterá-lo após a verificação da VM como funcionando. Então esqueci de mudar.
Remover o endereço MAC duplicado da VM e permitir que ele fosse randomizado resolveu o problema.