在通过负载均衡器运行托管在两个应用服务器中的网站时,突然一个应用服务器停止工作并挂起。从其他应用服务器访问日志中发现 499 状态并且平均负载也很高。大约 20 分钟后,它开始提供 200 状态。然后,当另一个应用服务器完全重新启动时,它也开始正常工作。
我不明白为什么会突然发生这种情况。从错误日志中,我发现了以下问题:
2019/11/03 12:43:19 [error] 26445#0: *30538354 FastCGI sent in stderr: "PHP message: PHP Fatal error: Allowed memory size of 268435456 bytes exhausted (tried to allocate 47264368 bytes) in /.........../sites/all/modules/contrib/memcache/dmemcache.inc on line 64" while reading response header from upstream, client: ............, server: .........., request: "................", upstream: "fastcgi://unix:/var/run/php-fpm/php-fpm.sock:", host: "...........", referrer: "..........."
现在,我需要做些什么来解决这个问题,以便将来永远不会发生?
您需要增加
php.ini
文件中每个 PHP 进程的内存限制。它现在似乎设置为 256MB。请务必在进行更改后重新启动您的 Web 服务器。更广泛地说,您未能在 memcache 模块内分配内存。这表明您正在尝试加载一个非常大的缓存对象(根据错误消息,大约 47 MB)。在一个运行在 256 MB 内存限制下的服务器中,将近 20% 的内存花在单个对象上不会很好。
在 Drupal 中,这表现为几种形式:您可能需要“克服困难”并且 47 MB 是一个中间对象,在这种情况下,您会看到简单的页面加载成功,然后任何依赖于该 47 MB 对象的页面加载失败,直到其中一个成功,然后所有加载都成功。或者该对象可能是凝聚的,在这种情况下,您会看到请求开始正常,然后在当天晚些时候开始失败。或者该对象可能特定于站点的特定部分,甚至是特定的本地化。真的很难知道,我的观点是症状并不总是一致的,甚至可能看起来不确定。
要进行调试,您可以从直接查询 memcache 以查看大约该大小的缓存中的内容开始,或者通过打开 memcache 模块中的详细日志记录,以便它会
GET
在失败时告诉您它正在尝试什么。有关如何执行后者的详细信息,请参阅此链接的“调试日志记录”部分,至少在 D7 中。如果有的话,您还可以从完整的堆栈跟踪中推断出一些额外的上下文。最终,正如 Bert 在这里所暗示的那样,调试它可能远远超出了您想要做的范围。在这种情况下,增加
memory_limit
肯定会使问题暂时消失。虽然这似乎是一个简单的出路,但请记住,在您执行上述调试步骤之前,该问题是否会再次出现仍将是一个无法回答的问题。