Estou solucionando problemas de uma instância AWS RDS Postgres que foi reiniciada pela AWS várias vezes nos últimos dias, muito provavelmente devido a restrições de recursos. É um banco de dados de teste que geralmente não faz muito, mas recentemente colocamos uma carga maior nele. Descobri que o volume EBS do banco de dados (200 GB gp3) esgotou seus créditos de taxa de transferência e que os tempos de reinicialização do banco de dados coincidiram muito bem com a métrica EBSByteBalance% chegando a zero. Então, quando o banco de dados é reiniciado, o volume aparentemente recebe um novo conjunto de créditos de rajada, como pode ser visto na captura de tela abaixo:
Os créditos agora caem um pouco mais devagar, pois aliviamos a carga no banco de dados, mas eles ainda estão caindo. Quando olho para as métricas atuais de taxa de transferência de leitura e gravação, elas parecem somar cerca de 5 a 7 MiB/s com picos ocasionais:
Com base nas informações encontradas aqui no armazenamento de instâncias de banco de dados do Amazon RDS, a taxa de transferência de linha de base para um volume gp3 abaixo de 400 GB deve ser de 125 MiB/s. Então, alguém pode me ajudar a explicar por que a métrica EBSByteBalance% continua diminuindo neste cenário? Obrigado!
Ok, segui o conselho de @Tim e entrei em contato com o suporte da AWS. Eles esclareceram o seguinte:
Então, o que aconteceu foi que a classe de instância de banco de dados T4G também tem um limite de I/O e taxa de transferência que, em nosso caso, era de cerca de 10 MB/s. Eu não sabia disso e tive muita dificuldade em encontrar esses números de desempenho online. Mas para qualquer um que se pergunte no futuro, eles podem ser encontrados aqui: https://instances.vantage.sh/rds/ Eles também confirmaram que, sob restrições de recursos, a instância do RDS pode ser reinicializada e veem isso como a explicação óbvia para o comportamento que testemunhamos.
Então o mistério está resolvido no nosso caso. espero que isso ajude alguém no futuro