在发送电子邮件后,我们的 rackspace wordpress 服务器因中等流量而出现故障。
服务器规格如下:
CPU 2 vCPUs
RAM 2 GB
System Disk 80 GB
Network 240 Mb / s
Disk I/O Good
跑步:
Centos 7.0
Wordpress 4.3.1
Httpd 2.4.6
PHP 5.4.11
MariaDB 5.5.41
据我所知,安装都是相当标准的,数据库非常标准,索引并且相当小。我们也是 wordpress 对象缓存。
根据新遗物;在正常流量期间,网站大约 80% 的时间花在 PHP 上,15% 的时间花在 Web 外部,只有一小部分时间花在数据库上。平均标准页面应用程序时间约为 800 毫秒,这对我来说确实很慢。
在 1 分钟内运行 250 个连接的负载测试会导致连接花费的时间逐渐变长,然后在大约 30 分钟后开始超时,并且服务器变得无响应(即使流量减少了)。它需要硬重启才能再次激活。
我无法使用腻子进行连接,主页在超时和返回可怕的“建立数据库连接时出错”之间摇摆不定。
在最近的测试中使用机架空间监控代理,CPU 似乎在死亡前达到了 100% 的最大值,使用的内存达到了大约 1.6GB 的峰值,而免费下降到大约 100MB。看起来也使用了大约 2GB 的交换内存(总共 4GB)。标准使用似乎是大约 15% 的 CPU、800MB 内存和 400MB 交换空间。
我们的 Apache 配置没有设置以下任何内容(没有文件在/etc
做);超时、KeepAlive、MaxKeepAliveRequests、KeepAliveTimeout;所以我猜它正在使用默认值。
我查看了 mariadb 设置:
innodb_buffer_pool_size = 1400M
max_user_connections = 0
这似乎不是原因。
我也打开了 performance_schema,但我真的不知道我在找什么。我什至不确定数据库是问题所在。
我很想升级实例,但我宁愿更清楚地了解瓶颈在哪里以及导致服务器死机的原因,而不是放慢速度。
关于从哪里开始的任何想法?那里似乎有很多可能的调整和大量信息。
在任何类型的事件期间密切监控都是至关重要的。正如我们所见,真相浮出水面:
众所周知,PHP 占用大量 CPU。您已经使用了所有可用的 CPU 和几乎所有可用的 RAM。
您应该首先采取措施来处理它,例如操作码缓存(例如 Zend OPcache)和文件缓存(例如 W3 Total Cache WordPress 插件)。如果这些都没有足够的帮助,那么是时候升级实例了。
您可能只是一次运行了太多进程,内存不足并搅动了交换。可能是其他东西被锁定了,但先处理这个,然后看看你在哪里。
您还没有告诉我们您使用的是 mod_php 还是 php-fpm 之类的东西。后者可以更好地处理负载,但在任何一种情况下,请确保您运行的 php 进程不会超过您的内存。运行超过 5 或 10 个进程可能不会获得任何性能优势,但特别是 mod_php 的默认运行将运行得比你的内存要多得多。此外,每 30 个左右的请求回收进程。如果您为您的数据库和操作系统分配 1GB,那么您的其他 GB 可能无法处理 10 个 WordPress 进程。看看他们占用了多少内存并计算出来,有一点间隙。您不应该在正常情况下使用任何交换。
查看您的保活设置。使用 Apache,您可能最好将其关闭,或将其设置为 1 秒。Nginx 可以更好地处理 keep-alive。事实上,这是 nginx 使用 WordPress 之类的 php 应用程序可能会表现得更好的唯一真正重要的原因(尽管它的代价是配置不太愉快)。这很可能不是您的测试的一个因素,但对于真正的浏览器很重要。
100% CPU 让我吃惊。使用 top 查看正在使用它的内容。还要记住,100% 通常意味着一个内核的 100%。您可能只是看到一个 cron 作业开始执行,对于 WordPress,它通常不是“cron”,而是在处理 Web 请求时作为额外的作业运行。缺少操作码缓存也可能导致 CPU 使用率过高。