我们有一个PHP
应用程序运行在单个实例EC2
, Ubuntu 16.04
, with NGINX
,PHP-FPM
上游。我们使用外部服务 (pingdom) 来监控我们的 Web 应用程序。这是一个安静的月份,正常运行时间为 99.9%。
昨晚凌晨 3 点左右,Web 应用程序在 30 分钟内无法访问,然后又变得可以访问。什么也没做,我们只在早上才注意到停电。
NGINX
access.log
显示与停机时间匹配的访问请求有 30 分钟的间隔。在那段时间没有收到任何请求NGINX
,所以我知道这不是应用程序上游的故障,或者PHP-FPM
(我们之前有过)。NGINX
错误日志在那段时间是干净的。不用说,当时的PHP-FPM
PHP 日志没有错误。
知道这可能是什么吗?我还应该在哪里尝试了解为什么服务器在 30 分钟内无法从外部访问(超时),然后在我没有进行任何更正的情况下突然恢复正常?这可能是AWS中的东西吗?网络中断?
我欢迎任何想法。
https://status.aws.amazon.com/