我正在尝试将节点添加到 Cloudera 集群。当代理启动时,我得到一个 python 堆栈跟踪,说它无法心跳到主主机:7182,但是我可以很好地连接到该端口。
堆栈跟踪来自 Python,并以连接超时结束。
nc -z 1 -w master-host 7182
返回“连接成功”
防火墙已关闭,SELinux 处于许可状态。
每个盒子有 2 个 IP,一个在 4 空间,一个在 8 空间。DNS解析8地址,hosts文件解析4地址。
编辑:添加更多信息,基于这篇文章:
- 操作系统版本相同,代理/管理器版本相同
- 我可以从 CM 主机连接到 4 地址,端口 9000。4 地址是显示在 Cloudera Manager 的主机页面中的地址
- large ping 命令在 4 address: 上失败
ping -c 3 -s 1800 4-address
,此接口的 MTU 设置为 9000。 - 大 ping 命令传递 8 个地址,MTU 设置为 1500。
事实证明,MTU 似乎是问题所在——我们使用的基础设施不支持端到端的巨型帧(在这种情况下,具有光纤互连的 Cisco c240m4s 需要通过 UCS 更新 QoS 设置)。