我注意到 AWS 自动扩展组存在一个非常奇怪的问题。
实例被(错误地)报告为不健康。然后实例被不必要地终止和替换。这会导致问题,因为它使 ASG 没有足够的能力来应对负载。
为了找出问题所在,我暂时暂停了 ASG 的“终止”进程。
目前,我在组中有一个实例被 ASG 报告为不健康。登录实例并直接测试健康检查证明它实际上是健康的。
此外,与 ASG 关联的负载均衡器还将所有实例报告为运行状况良好。
我的问题是。如果组的运行状况检查类型设置为“ELB”,并且负载均衡器报告该实例是健康的,我的 ASG 如何将实例视为“不健康”?
有没有办法可以找出 ASG 何时以及为何将这些实例标记为“不健康”?
此 ASG 当前与 2 个经典 ELB 和 2 个 ALB 目标组相关联。我们正在从 ELB 迁移到 ALB。
如前所述,两个 ELB 和两个目标组都将所有实例报告为健康。
我猜问题来自多个 ELB / ALB TG 的实例部分。我怀疑这些 ELB / ALB 中的任何一个都可以触发实例终止,如果它认为它出于任何原因不健康的话。
将运行状况检查类型更改为EC2,直到您完成迁移。
最佳做法是让ASG 仅绑定到一个负载均衡器。
希望有帮助:)