現場実践｜AWS Auto Scaling設計

AWS Auto Scalingの設計と実践｜EC2スケーリングポリシーと本番環境での安定稼働

「急なアクセス急増でEC2が落ちた」「コスト削減のためにサーバーを自動で減らしたい」——AWS Auto ScalingのEC2 Auto Scalingグループ・スケーリングポリシーの種類・本番環境での安定稼働のための設定を解説します。

読了目安：約15分更新日：2026年4月

💡 Auto Scalingは「負荷に応じてEC2を自動で増減させる」サービス。「繁忙期だけ台数を増やす」「深夜は台数を減らしてコストを削減する」という設計がAWSで最も費用対効果の高いアプローチです。

この記事を書いた人

現役ITエンジニア・IT講師（経験14年）

CCNA・CCNP 取得LPIC-1 保有SES現場を複数経験

AWS環境のAuto Scaling設計・本番環境での安定稼働を多数担当してきた立場から解説します。

1. Auto Scalingグループの基本設定

起動テンプレートを使う：EC2の起動設定は必ず起動テンプレート（Launch Template）を使う。旧来の起動設定（Launch Configuration）は非推奨になっている
マルチAZ配置：Auto Scalingグループは必ず複数のアベイラビリティゾーンにまたがって配置する。1つのAZに障害が発生しても残りのAZで継続稼働できる
最小・希望・最大台数の設定：最小台数は本番環境では2台以上に設定。希望台数はクールタイム経過後の安定台数。最大台数はコスト上限として機能する

ポリシー種別	動作の仕組み	適したユースケース
シンプルスケーリング	CloudWatchアラームがトリガーされたら指定台数を追加・削除	シンプルな設定で十分な場合
ステップスケーリング	CPU使用率の閾値に応じて段階的に台数を変更（60%→+2台、80%→+4台等）	負荷の変化が大きいWebアプリ
ターゲット追跡スケーリング	CPU使用率を指定した目標値に維持するよう自動調整（例：CPU50%を維持）	最も推奨。シンプルで効果的