AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 392733
Accepted
ILikeFood
ILikeFood
Asked: 2012-05-26 08:44:53 +0800 CST2012-05-26 08:44:53 +0800 CST 2012-05-26 08:44:53 +0800 CST

Hadoop 从节点未连接

  • 772

我一直在尝试建立一个 Hadoop 集群;我设法让它以伪分布式模式运行,我的一台机器在大约 30 秒内完成了托尔斯泰的《战争与和平》字数统计。

我现在正在尝试将第二台机器添加到我的集群中;为了帮助设置它,我创建了一个 Hadoop 用户组,该组具有在 Hadoop 服务器上启动、停止和运行作业的权限(尽管我只让 root 编辑配置文件)。我确保 hadoop 组的所有成员都可以使用他们的公钥从主节点到从节点进行 ssh。我使用 dpkg 安装了 hadoop 1.0.0.3。我在主节点和从节点上正确编辑了主从文件,并更改了配置以指向正确的 NameNode 和 JobTracker:

在 core-site.xml 中:
fs.default.name=hdfs://$MASTER:9000

在 mapred-site.xml 中:
mapred.job.tracker=$MASTER:9001

其中 $MASTER 是我的主机的主机名。

我的 NN、SNN 和 JobTracker 启动正确;但是,我的从节点无法连接到我的主节点!这是我在 DataNode 日志中看到的行为:

2012-05-25 09:36:23,390 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: $MASTER/10.23.95.197:9000. Already tried 0 time(s).
2012-05-25 09:36:23,390 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: $MASTER/10.23.95.197:9000. Already tried 1 time(s).
...
...
connect to server: $MASTER/10.23.95.197:9000. Already tried 9 time(s).
2012-05-25 09:36:31,394 INFO org.apache.hadoop.ipc.RPC: Server at $MASTER/10.23.95.197:9000 not available yet, Zzzzz...

一而再,再而三。我在 TaskTracker 日志中看到了同样的内容,除了那里列出的端口号是 9001。lsof 告诉我正确的进程正在两个端口上侦听。出了什么问题???

来自 $MASTER 的所有日志都可以在http://pastebin.com/ZzyKBQVJ找到

谢谢; 如果您有任何问题,请告诉我。

hadoop
  • 4 4 个回答
  • 15588 Views

4 个回答

  • Voted
  1. Best Answer
    ILikeFood
    2012-07-10T09:54:15+08:002012-07-10T09:54:15+08:00

    这个问题一般不是Hadoop配置的问题,更多的是集群的网络配置问题;在我的例子中,这是由这个问题引起的。如果您看到此行为,请/etc/hosts在查看 Hadoop 文件之前检查您的路由等是否存在问题。

    • 0
  2. Bramh Gupta
    2013-10-08T05:59:03+08:002013-10-08T05:59:03+08:00

    我在 Rackspace 上设置 5 节点集群时遇到了类似的问题。我仔细检查了我的/etc/hosts文件。问题实际上是防火墙。数据节点通过端口与主节点通信9000。您将需要打开该端口进行通信。您还需要50010在数据节点上打开端口,以便主节点进行通信以管理任务跟踪器。

    此外,主节点还应该9001为作业跟踪器通信打开端口。

    为所有这些更新 iptables。

    在主节点上:

    iptables -I INPUT -p tcp --dport 9000  -j ACCEPT
    iptables -I INPUT -p tcp --dport 9001  -j ACCEPT
    service iptables save
    service iptables reload
    

    在每个数据节点/任务跟踪器上:

    iptables -I INPUT -p tcp --dport 50010  -j ACCEPT
    service iptables save
    service iptables reload
    
    • 0
  3. Sanjay Thakre
    2014-08-09T01:05:13+08:002014-08-09T01:05:13+08:00

    在集群中运行 map reduce 程序时,我也遇到了同样的错误。有时工作成功,有时失败。

    我集群中的所有系统都是本地连接的。我通过使用以下命令在集群的所有机器中禁用防火墙解决了这个问题:

    $ systemctl 禁用 firewalld 或 $ systemctl 停止 firewalld

    如果您没有 root 访问权限,请在命令前使用 sudo。我使用的是 fedora 20。如果您使用的是旧版本的 linux,请检查如何在这些系统中禁用防火墙。

    我希望这能帮到您。

    问候,桑杰·塔克雷

    • 0
  4. Raxit Solanki
    2017-11-16T13:37:17+08:002017-11-16T13:37:17+08:00

    我也遇到了类似的问题。(我使用的是 ubuntu 17.0) >sudo gedit /etc/hosts (在主机和从机中)

    127.0.0.1  localhost
    192.168.201.101 master
    192.168.201.102 slave1
    192.168.201.103 slave2
    

    其次,> sudo gedit /etc/hosts.allow添加条目: ALL:192.168.201.

    禁用防火墙> sudo ufw disable

    让它工作。

    • 0

相关问题

  • gitosis 干扰 hadoop

  • HDFS 中的“流式数据访问”是什么意思?

  • hadoop - 数据节点退役

  • 什么是 Hadoop,它的用途是什么?[关闭]

  • Hadoop 集群。2 台快速、4 台中等、8 台较慢的机器?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve