Dois dias atrás, nossa instância MySQL RDS viu um aumento repentino em BinLogDiskUsage, CPUUtilization, NetworkReceiveThroughput e NetworkTransmitThroughput.
O resultado foi um banco de dados extremamente lento para responder, mas que não deixava de responder. As solicitações às APIs conectadas ao banco de dados demoravam 10 vezes mais para responder do que o normal.
O WAF não indicou um aumento no tráfego (embora tenha coincidido com o que normalmente é o período mais movimentado do dia).
Em três horas, a situação se resolveu e os tempos de resposta voltaram ao normal.
Minhas perguntas são:
- O que faria com que BinLogDiskUsage aumentasse repentinamente?
- Por que isso faria com que o banco de dados ficasse tão lento, já que a CPUUtilization atingiu apenas cerca de 20%? (Estou confundindo causa e efeito?)
Se for útil, max_binlog_size
é134217728
Desde a gravação em logs binários, quando há muitos INSERTs, UPDATEs, DELETEs e alguns DDL, você precisa procurar por quaisquer processos em sua extremidade que estariam carregando dados em massa.
EXEMPLOS
A única maneira de responder a esta pergunta é executar o
mysqlbinlog --read-from-remote-server
dump do conteúdo dos logs binários para um arquivo de disco (se os logs binários de 2 dias atrás ainda estiverem disponíveis).Você deveria executar isso
deixar os logs binários por 1 semana (336 seriam duas semanas)
Em seguida, examine o conteúdo do log binário e veja quais foram os eventos.