Estou tentando adicionar nós a um cluster Cloudera. Quando o agente é iniciado, recebo um stacktrace python dizendo que não pode pulsar para master-host:7182, no entanto, posso me conectar a essa porta perfeitamente.
O stacktrace é do Python e termina dizendo que a conexão expirou.
nc -z 1 -w master-host 7182
retorna "conexão bem-sucedida"
Os firewalls estão desativados, o SELinux está em Permissivo.
Cada caixa tem 2 IPs, um no espaço 4 e outro no espaço 8. O DNS resolve o endereço 8 e o arquivo hosts resolve o endereço 4.
EDIT: Para adicionar mais algumas informações, com base nesta postagem :
- As versões do sistema operacional são as mesmas, as versões do agente/gerente são as mesmas
- Posso me conectar do host CM ao endereço 4, porta 9000. O endereço 4 é aquele que aparece na página Host no Cloudera Manager
- O comando ping grande falha no endereço 4:
ping -c 3 -s 1800 4-address
, MTU para esta interface é definido como 9000. - O comando ping grande passa no endereço 8, o MTU é definido como 1500.
Acontece que o MTU parecia ser o problema - a infraestrutura que estamos usando não suportava quadros jumbo de ponta a ponta (neste caso, Cisco c240m4s com interconexões de fibra precisavam da atualização das configurações de QoS via UCS).