Ross Messiah提出的问题 -server

Ross Messiah

Asked: 2016-10-20 06:32:49 +0800 CST

被“TCP：时间等待桶表溢出”错误淹没——我能做些什么来缓解？

我有一个运行 Debian 7 (proxmox) 托管 OpenVZ 容器的遗留系统，我看到一个麻烦的问题，即系统被与运行 apache 前端的 VZ 容器的开放连接所淹没。

发生这种情况时，服务器上的日志会充满数千个“TCP：时间等待桶表溢出 (CT233)”错误。这与来自网络服务器的缓慢响应相结合。我能做些什么来缓解这个问题吗？

在谷歌搜索之后，我对各种 conntrack 设置进行了一些调整，但如果没有更好地了解可能产生的影响（或者，实际上，这是否真的可能有助于任何情况）

为了了解情况是什么，这是今天发生这种情况时“sysctl -a | grep conntrack”的输出：

net.netfilter.nf_conntrack_generic_timeout = 480
net.netfilter.nf_conntrack_tcp_timeout_syn_sent = 120
net.netfilter.nf_conntrack_tcp_timeout_syn_recv = 60
net.netfilter.nf_conntrack_tcp_timeout_established = 345600
net.netfilter.nf_conntrack_tcp_timeout_fin_wait = 120
net.netfilter.nf_conntrack_tcp_timeout_close_wait = 60
net.netfilter.nf_conntrack_tcp_timeout_last_ack = 30
net.netfilter.nf_conntrack_tcp_timeout_time_wait = 120
net.netfilter.nf_conntrack_tcp_timeout_close = 10
net.netfilter.nf_conntrack_tcp_timeout_max_retrans = 300
net.netfilter.nf_conntrack_tcp_timeout_unacknowledged = 300
net.netfilter.nf_conntrack_tcp_loose = 1
net.netfilter.nf_conntrack_tcp_be_liberal = 0
net.netfilter.nf_conntrack_tcp_max_retrans = 3
net.netfilter.nf_conntrack_udp_timeout = 30
net.netfilter.nf_conntrack_udp_timeout_stream = 180
net.netfilter.nf_conntrack_icmp_timeout = 30
net.netfilter.nf_conntrack_acct = 0
net.netfilter.nf_conntrack_events = 1
net.netfilter.nf_conntrack_events_retry_timeout = 15
net.netfilter.nf_conntrack_max = 131072
net.netfilter.nf_conntrack_count = 128397
net.netfilter.nf_conntrack_buckets = 32768
net.netfilter.nf_conntrack_checksum = 1
net.netfilter.nf_conntrack_log_invalid = 0
net.netfilter.nf_conntrack_expect_max = 256
net.nf_conntrack_max = 131072

这包括我今天所做的一些更改：我将 nf_conntrack_buckets 从 16384 翻倍到 32768，我将 conntrack_generic_timeout 从 600s 缩小到 480s，并将 conntrack_tcp_timeout_builted 从 5d 缩小到 4d。

在任何给定时间，绝大多数打开的连接都在 TIME_WAIT 中。

我希望有比我推荐的更了解 TCP/内核调优的人。

谢谢！

Ross Messiah

Asked: 2016-05-06 07:11:52 +0800 CST

来自 Docker 容器内的流量路由不正确 - 来自 Docker 主机的流量正确路由

我看到一个奇怪的问题，来自位于欧洲西部 Google Cloud 中的 VM 上的 Docker 容器内的流量，发往位于亚马逊 Cloudfront 的英国公司，错误地一路路由到美国到达云端在加利福尼亚，导致各种不必要的延迟和缓慢。

$ ping destination.host.co.uk
PING d3csmaahmfmvav.cloudfront.net (54.192.146.219) 56(84) bytes of data.
64 bytes from server-54-192-146-219.sfo4.r.cloudfront.net (54.192.146.219): icmp_seq=1 ttl=49 time=161 ms

但是，源自主机 VM 的流量会正确路由到欧洲 Cloudfront 位置：

$ ping destination.host.co.uk
PING d3csmaafmvavjz.cloudfront.net (54.230.12.31) 56(84) bytes of data.
64 bytes from server-54-230-12-31.ams1.r.cloudfront.net (54.230.12.31): icmp_req=1 ttl=54 time=10.5 ms

我在 Docker 容器的网络配置中找不到任何可以表明为什么当主机本身将流量发送到我们期望的地方时容器会将流量发送到地球另一端的任何内容。

对于我的生活，我无法弄清楚为什么会这样，希望有人可以帮助指出我所缺少的。

谢谢！

被“TCP：时间等待桶表溢出”错误淹没——我能做些什么来缓解？

来自 Docker 容器内的流量路由不正确 - 来自 Docker 主机的流量正确路由

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？

Ross Messiah's questions

被“TCP：时间等待桶表溢出”错误淹没——我能做些什么来缓解？

来自 Docker 容器内的流量路由不正确 - 来自 Docker 主机的流量正确路由

新安装后 postgres 的默认超级用户用户名/密码是什么？

SFTP 使用什么端口？

命令行列出 Windows Active Directory 组中的用户？

什么是 Pem 文件，它与其他 OpenSSL 生成的密钥文件格式有何不同？

如何确定bash变量是否为空？