AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1163765
Accepted
jtlindsey
jtlindsey
Asked: 2024-08-11 22:22:18 +0800 CST2024-08-11 22:22:18 +0800 CST 2024-08-11 22:22:18 +0800 CST

本地服务器和远程服务器之间的 SSH 连接问题

  • 772

在生产服务器上,我有一个自动化任务,每分钟通过网络向远程生产服务器发送一次相同的 SSH 命令和数据量。唯一可能改变的是对象中的几个值。这个过程已经在程序中运行多年,没有出现问题。没有任何本地更改,我们开始出现随机的ECONNRESET和Connection lost before handshake错误实例。一开始每天只有几个,后来增加到每小时多个。目标服务器管理员说他们的日志没有提供有用的信息……只是说Received disconnect from <origin_ip> port 21549:11或pam_unix(sshd:session): session closed for user <username>。

由于连接最初是成功的(socket connected),ssh -vvv或者我的 ssh 工具中的等效功能在发送所有数据之前连接中断时无法收集其他数据。有时套接字连接后不到 12 秒就会断开连接。

我运行mtr <destinatioin_ip>检查跟踪,发现在 9 个跳转中,只有最后一跳(目的地)有数据包丢失。通常情况下,丢失率在 12% 到 20% 之间。从不低于 6%。但考虑到它使用的是 ping/ICMP,有时会受到限制,我认为它不能可靠地确认 ssh 连接存在问题。因此,我运行mtr -T -P 22 <destination_ip>检查 SSH/TCP,它经常显示前 8 个跳转的丢失率为 0%,仅在目的地第 9 个跳转处丢失了多达 29% 的数据包。但不太常见的是,它有时在前 8 个跳转中都显示高达 50% 的数据包丢失,并且从未到达第 9 个跳转。令人困惑。

在进行上述测试或让自动化程序自行重试时,最终目标服务器将阻止我的所有 SSH 连接。此时ssh -vvv <destination_ip>将挂起,然后显示连接超时:

ssh -vvv <user@destination_ip>
OpenSSH_7.6p1 Ubuntu-4ubuntu0.7, OpenSSL 1.0.2n  7 Dec 2017
debug1: Reading configuration data /etc/ssh/ssh_config
debug1: /etc/ssh/ssh_config line 19: Applying options for *
debug2: resolving "<destination_ip>" port 22
debug2: ssh_connect_direct: needpriv 0
debug1: Connecting to <destination_ip> [<destination_ip>] port 22.
debug1: connect to address <destination_ip> port 22: Connection timed out
ssh: connect to host <destination_ip> port 22: Connection timed out

为了解决这个问题connection timed out,目标服务器管理员说他重新启动了 ssh 服务器。此时我可以再次连接,但随机断开连接的情况会继续,直到最终再次被完全阻止。

pfSense 是与 Ubiquiti 交换机一起用于源服务器网络的防火墙。源防火墙显示没有被阻止的 SSH 连接,并且与目标服务器同时建立的 SSH 连接从未超过 2-3 个。

以上内容是否足以说明问题至少不是我的服务器,而可能是目标服务器(跳数 9)?如果原因出在本地,我还应该在本地查看其他内容以进行隔离吗?

我完全控制本地生产服务器。问题是,如果没有足够的证据证明问题不是本地问题,我就很难让远程团队上报,让他们做进一步的研究。

networking
  • 1 1 个回答
  • 161 Views

1 个回答

  • Voted
  1. Best Answer
    symcbean
    2024-08-12T00:02:22+08:002024-08-12T00:02:22+08:00

    我运行了 mtr <destinatioin_ip> 来检查跟踪,经过 9 次跳跃后,只有最后一跳(即目的地)发生了数据包丢失。丢失率通常在 12% 到 20% 之间。

    故事结束。问题已确定。没有讨论限制 ping。如果他们不承担责任,请升级。

    • 3

相关问题

  • 谁能指出我的 802.11n 范围扩展器?

  • 我怎样才能得到一个网站的IP地址?

  • 在一个 LAN 中使用两台 DHCP 服务器

  • 如何在 Linux 下监控每个进程的网络 I/O 使用情况?

  • 为本地网络中的名称解析添加自定义 dns 条目

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve