Eu tenho um grupo de instâncias gerenciadas com um LB HTTP(S) na frente dele. Atualmente, configurei uma política de autoescalador para aumentar ou diminuir a escala com base na utilização da CPU e o limite é definido como 70%.
Mas observei que, se houver algum pico momentâneo no uso da CPU por um curto período, novas instâncias serão adicionadas e imediatamente após alguns minutos, algumas das instâncias existentes serão excluídas, pois o uso da CPU teria caído.
Quero que o autoescalador ignore quaisquer picos momentâneos dizendo adicionar mais instâncias somente se o uso da CPU ultrapassar 70% por mais de 5 minutos.
Como faço para conseguir isso?
Atenciosamente,
Shobana
Normalmente , o escalonamento automático cria ou exclui VMs dinamicamente para atender ao destino do grupo, não por instância individual. Essas metas são baseadas na utilização geral do grupo.
Por exemplo
gcloud compute instance-groups managed set-autoscaling example-managed-instance-group --max-num-replicas 20 --target-cpu-utilization 0.75 --cool-down-period 90
Teste: Durante períodos de uso intenso da CPU, se a utilização chegar perto de 100%, o autoescalador estima que o Grupo já pode estar sobrecarregado. Nesses casos, o autoescalador aumenta o número de instâncias em pelo menos 50% a mais ou um mínimo de 4 instâncias, o que for maior. Atualmente, não há opção disponível para especificar o intervalo de tempo para monitoramento sequencial da utilização total antes de aumentar ou diminuir a escala.
Você pode relatar isso como uma solicitação de recurso com os Issue Trackers.