Estamos tendo problemas com nosso servidor wordpress rackspace caindo com tráfego médio após o envio de um e-mail.
As especificações do servidor são:
CPU 2 vCPUs
RAM 2 GB
System Disk 80 GB
Network 240 Mb / s
Disk I/O Good
Corrida:
Centos 7.0
Wordpress 4.3.1
Httpd 2.4.6
PHP 5.4.11
MariaDB 5.5.41
A instalação é bastante padrão, até onde posso dizer, e o banco de dados é bastante padrão, indexado e bastante pequeno. Também somos cache de objetos wordpress.
De acordo com a New Relic; durante o tráfego normal, o site gasta cerca de 80% do tempo em PHP, 15% do tempo na web externa e apenas uma pequena porcentagem no banco de dados. O tempo médio padrão do aplicativo de página é de cerca de 800 ms, o que parece lento para mim.
A execução de um teste de carga de 250 conexões em 1 minuto faz com que as conexões demorem progressivamente mais e comecem a expirar após cerca de 30, e o servidor pare de responder (mesmo quando o tráfego diminui). Requer uma reinicialização forçada para se tornar ativo novamente.
Não consigo me conectar usando o putty e a página inicial oscila entre o tempo limite e o retorno do temido 'Erro ao estabelecer conexão com o banco de dados'.
Usando o agente de monitoramento de espaço em rack no teste mais recente, parece que a CPU está atingindo o máximo de 100% pouco antes da morte, a memória usada atinge o pico de cerca de 1,6 GB com queda livre para cerca de 100 MB. Parece que cerca de 2 GB de memória de troca (total de 4 GB) também está sendo usado. O uso padrão parece ser de cerca de 15% da CPU, 800 MB de memória e 400 MB de swap.
Nossa configuração do Apache não define nenhum dos itens a seguir (nenhum arquivo em /etc
do); Tempo limite, KeepAlive, MaxKeepAliveRequests, KeepAliveTimeout; então eu estou supondo que está usando os valores padrão.
Eu olhei para as configurações do mariadb:
innodb_buffer_pool_size = 1400M
max_user_connections = 0
O que não parece ser a causa.
Também ativei o performance_schema, mas realmente não sei o que estou procurando. Eu nem tenho certeza se o DB é o problema.
Estou tentado a atualizar a instância, mas prefiro ter uma visão mais clara de onde está o gargalo e o que está causando a interrupção do servidor, em vez de apenas desacelerar.
Alguma ideia de por onde começar? Parece haver muitos ajustes possíveis por aí e muita informação.
O monitoramento próximo durante qualquer tipo de evento é crucial. Como vemos, a verdade veio à tona:
O PHP é bem conhecido por ser bastante intensivo em CPU. Você usou toda a CPU disponível e quase toda a RAM disponível.
Você deve primeiro tomar medidas para lidar com isso, como cache de opcode (por exemplo, Zend OPcache) e cache de arquivo (por exemplo, plug-in W3 Total Cache WordPress). Se isso não ajudar o suficiente , é hora de atualizar a instância.
Você provavelmente está apenas executando muitos processos ao mesmo tempo, ficando sem memória e fazendo swap. Pode ser que algo mais esteja travando, mas lide com isso primeiro e depois veja onde você está.
Você não nos disse se está usando mod_php ou algo como php-fpm. O último lida melhor com a carga, mas em ambos os casos, certifique-se de não executar mais processos php do que a memória necessária. Você provavelmente não obterá nenhum benefício de desempenho executando mais de 5 ou 10 processos, mas a execução padrão do mod_php em particular executará muito mais do que você tem memória. Além disso, recicle processos a cada 30 ou mais solicitações. Se você der 1 GB para seu banco de dados e sistema operacional, seu outro GB provavelmente não lidará com 10 processos do WordPress. Veja quanta memória eles ocupam e resolvem, com um pouco de folga. Você não deve usar nenhuma troca no curso normal das coisas.
Veja suas configurações de manutenção de atividade. Com o Apache, provavelmente é melhor desligá-lo ou configurá-lo para 1 segundo. O Nginx lida com o keep-alive muito melhor. Na verdade, esta é a única razão realmente importante pela qual o nginx provavelmente terá um desempenho melhor com um aplicativo php como o WordPress (embora tenha o custo de uma configuração menos agradável). Isso provavelmente não é um fator em seu teste, mas é importante em navegadores reais.
CPU 100% me surpreende. Use top para ver o que está usando. Lembre-se também de que 100% geralmente significa 100% de um núcleo. Você pode estar vendo apenas um trabalho cron sendo iniciado, que com o WordPress normalmente não é "cron" como tal, mas os trabalhos são executados como um extra durante o processamento de solicitações da web. A falta de cache do opcode também pode estar causando alto uso da CPU.