ECS サービスのヘルスチェック未通過を解消する対策の優先順位
AWS
ECS
インフラ
ECS/Fargate でデプロイ時にヘルスチェックを通過できずタスクが再起動ループする場合、効果が大きい順に:
- タスクの CPU を増やす (例 256→512)。起動が速くなり grace 期間内に /health が 200 を返せるようになる。最小変更で最も効きやすい。
- ヘルスチェック窓を緩める:
healthCheckGracePeriodSecondsを拡大 (30→120〜180s)、healthy threshold を緩和 (5→2〜3)。 deploymentCircuitBreakerを有効化 (rollback: true) し、失敗デプロイで無限ループせず早期検知・ロールバックする。
同一イメージ・同一エントリポイントでも、サービスごとに CPU 割り当てが異なると特定サービスだけ起動が間に合わず安定しないことがある点に注意。