情况
我正在运行Etherpad,它是通过 nginx 代理的。Etherpad 使用带有 Socket.io 的 Websockets。
我的 nginx 配置或多或少是这个。socket.io 的位置块是这样的:
rewrite /CustomSubDir/socket.io/(.*) /socket.io/$1 break;
proxy_pass http://localhost:CustomPort/;
proxy_redirect / /CustomSubDir/;
proxy_cookie_path / /CustomSubDir/;
# usual proxy header
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
proxy_set_header X-NginX-Proxy true;
# websocket
proxy_set_header Accept-Encoding "";
proxy_http_version 1.1;
# http://nginx.org/en/docs/http/websocket.html
proxy_set_header Upgrade $http_upgrade;
proxy_set_header Connection $connection_upgrade;
proxy_set_header Host $host;
proxy_buffers 8 32k;
proxy_buffer_size 64k;
proxy_buffering off;
什么令人困惑
所以好消息是:一切正常!因此,我不是在问如何让任何事情发挥作用。
最基本的是:尽管一切正常,nginx 总是向我显示错误消息。
怎么了
nginx 在以下位置向我显示了这些错误error.log
:
2016/05/24 xx:yy:zz [error] 22197#0: *12059 connect() failed (111: Connection refused) while connecting to upstream, client: SOM.IPA.DDR.EES, server: somedomain.example.com, request: "GET /CustomSubDir/socket.io/?EIO=3&transport=polling&t=1464121868147-3&sid=H2GhIY24t2a40etpAACd HTTP/2.0", upstream: "http://[::1]:CustomPort/socket.io/?EIO=3&transport=polling&t=1464121868147-3&sid=H2GhIY24t2a40etpAACd", host: "somedomain.example.com"
2016/05/24 xx:yy:zz [error] 22197#0: *12070 connect() failed (111: Connection refused) while connecting to upstream, client: SOM.IPA.DDR.EES, server: somedomain.example.com, request: "POST /CustomSubDir/socket.io/?EIO=3&transport=polling&t=1464122037998-5&sid=T-pthraR669TF2cKAACe HTTP/2.0", upstream: "http://[::1]:CustomPort/socket.io/?EIO=3&transport=polling&t=1464122037998-5&sid=T-pthraR669TF2cKAACe", host: "somedomain.example.com"
所以我可以追踪这个请求。原因如下: 1. 这些显然是 Websocket 请求。2. 这些是——而且很特别——POST 请求。
当加载一个 Etherpad 或在失去连接后重新连接到一个 Etherpad 时,只会发出一个请求,它满足这些要求。我可以在浏览器中清楚地看到它,并且可以看到它实时出现在 nginx 错误日志中。这是我浏览器中的请求:
200 POST https://somedomain.example.com/CustomSubDir/socket.io/?EIO=3&transport=polling&t=1464121868143-2&sid=H2GhIY24t2a40etpAACd
它包含(例如)这个有效载荷:
164:42["message",{"component":"pad","type":"CLIENT_READY","padId":"CENSORED","sessionID":"null","password":null,"token":"t.qbszmj[...]","protocolVersion":2}]
服务器回复是:
HTTP/2.0 200 OK
Server: nginx
Date: Tue, 24 May 2016 xx:yy:zz GMT
Content-Type: text/html
Content-Length: 2
access-control-allow-origin: *
Set-Cookie: io=H2GhIY24t[...]
X-Firefox-Spdy: h2
ok
为什么我可以确定这是罪魁祸首
我很确定 POST 请求会导致这种情况。不仅因为它是访问 pad 时带有此 URL 的唯一 POST 请求,我还可以比较行为。因为在同一台服务器上我也运行Etherdraw,它的工作方式非常相似,但它有一个重要区别:它似乎不使用 POST Websocket 请求。
你猜怎么着?error.log
是空的。
我的问题
那么我的问题是什么:
- 我如何在我的浏览器中看到请求成功(带有正确的服务器回复!)而 nginx 报告我它在日志中失败?
- 我怎样才能摆脱这些错误信息?AFAIK 请求不会失败...
感谢@webzwo0i,我可以解决我的问题,他在 GitHub 上让我意识到这可能是 IPv4/IPv6 冲突。
所以我再次查看了错误日志,我特别注意到了这一点:
这是 IPv6 本地主机地址,但 Etherpad/NodeJS 似乎只连接到 IPv4 地址。
所以改变
localhost
nginx 配置中的所有 s 来127.0.0.1
解决我的问题。日志中的错误消失了。我还注意到其他一些请求也导致了日志中的相同错误,因此它并不特定于我描述的请求。