AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1078908
Accepted
ndtreviv
ndtreviv
Asked: 2021-09-29 06:00:01 +0800 CST2021-09-29 06:00:01 +0800 CST 2021-09-29 06:00:01 +0800 CST

ECS 上的 Flink taskmanager 无法连接到 EC2 上的 jobmanager

  • 772

我有一个在 us-east-1b 中的 EC2 实例,它正在运行 flink 作业管理器,它负责通过 RPC 和历史服务器协调多个任务管理器之间的工作。我可以从 netstat 看到 jobmanager 正在监听:::6123传入的 taskmanager 连接。

我有一个 Auto Scaling 组,它会将 EC2 实例运行到与 EC2 实例相同的 az、子网和安全组中。

安全组允许所有端口上的所有流量从组中的任何源到组中的任何目标: 入境规则 出站规则

我将该 ASG 用作 ECS 任务的容量提供程序。然后,我尝试在 ECS 中运行一个任务,该任务运行任务管理器并使用该 ASG。

任务管理器启动,但不会连接到作业管理器:

2021-09-28 13:52:08,651 INFO  org.apache.flink.runtime.taskexecutor.TaskExecutor           [] - Could not resolve ResourceManager address akka.tcp://[email protected]:6123/user/rpc/resourcemanager_*, retrying in 10000 ms: Could not connect to rpc endpoint under address akka.tcp://[email protected]:6123/user/rpc/resourcemanager_*.

我已经 ssh-d 到由 ASG 运行的实例上,并确认我可以 curl 作业管理器ip-xxx-xx-x-xxx.ec2.internal:8081- 它可以工作。所以我知道taskmanager实例可以看到jobmanager实例。

总结一下:

  • taskmanager和jobmanager在同一个VPC,同一个AZ,同一个子网,同一个安全组
  • 安全组允许来自同一安全组中源的所有入站流量
  • 安全组允许所有出站流量到任何目的地
  • 作业管理器在手动创建的 EC2 实例上运行
  • 任务管理器在 ECS 作为 ASG 的一部分创建的 EC2 实例上运行。任务管理器运行在 ECS 上的容器中
  • 我可以从任务管理器节点卷曲作业管理器
  • taskmanager 和 jobmanager 通过 RPC 通信
  • 任务管理器不会将地址解析给作业管理器

为什么我的任务无法连接?我还尝试了公共 IP (v4) 和私有 IP (v4)。

amazon-web-services amazon-ecs
  • 1 1 个回答
  • 477 Views

1 个回答

  • Voted
  1. Best Answer
    ndtreviv
    2021-09-30T07:10:22+08:002021-09-30T07:10:22+08:00

    今天我发现了为什么这不起作用。

    作业管理器配置为:

    jobmanager.rpc.address: localhost
    

    因此,在侦听正确的 rpc 端口时,不接受到任何其他地址的流量。

    当我更改它以匹配任务管理器时:

    jobmanager.rpc.address: ip-xxx-xx-x-xxx.ec2.internal
    

    然后任务管理器立即连接。

    • 1

相关问题

  • 与 AWS 中的其他系统相比,CentOS 报告的总内存较低

  • 如何在 Amazon Linux 服务器上升级到 Java 1.8?

  • 了解 Amazon AWS 使用数据

  • 亚马逊提供的负载均衡服务体验如何?

  • ELB 中现有节点的 AWS 自动缩放问题

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve