Amazon CloudWatchを使いこなす実践ガイド|カスタムメトリクス・アラーム・Logs Insights

現場実践|CloudWatch詳細活用
Amazon CloudWatchを使いこなす実践ガイド|カスタムメトリクス・アラーム・Logs Insights
「CloudWatchのアラーム設定の方法がわからない」「カスタムメトリクスって何?」——CloudWatchのメトリクス収集・カスタムメトリクス送信・アラーム設定・Logs Insightsでのログ分析を実践的に解説します。
💡 CloudWatchはAWSの統合監視サービス。「何かあったら通知が来る」仕組みを整備することがAWSインフラ運用の基本です。デフォルトメトリクス+カスタムメトリクスの組み合わせで死角のない監視を実現します。
1. CloudWatchのデフォルトメトリクス
| サービス | 主要メトリクス | 注意点 |
|---|---|---|
| EC2 | CPUUtilization・NetworkIn/Out | メモリ・ディスクはデフォルトでは収集されない。CloudWatchエージェントが必要 |
| RDS | CPUUtilization・FreeStorageSpace・DatabaseConnections | Enhanced Monitoringで1秒粒度のメトリクスが取れる |
| ALB | RequestCount・TargetResponseTime・HTTPCode_ELB_5XX | 5XXエラー率のアラームは必ず設定する |
| Lambda | Duration・Errors・Throttles | Throttlesが多い場合は同時実行数の制限を見直す |
2. CloudWatchエージェントでメモリ・ディスクを収集
# CloudWatchエージェントのインストール(Amazon Linux 2)
sudo yum install amazon-cloudwatch-agent
# 設定ウィザードを実行
sudo /opt/aws/amazon-cloudwatch-agent/bin/amazon-cloudwatch-agent-config-wizard
# エージェントを起動
sudo systemctl start amazon-cloudwatch-agent
sudo systemctl enable amazon-cloudwatch-agent設定ウィザードでメモリ使用率・ディスク使用率・ログファイルのパスを指定します。Systems Managerのパラメータストアに設定を保存して複数インスタンスに一括展開できます。
3. アラーム設定の実践
- 必ず設定すべきアラーム:EC2 CPU使用率80%超・RDS FreeStorageSpace残り20%未満・ALBの5XXエラー率1%超・Lambda Errorsが0より大きい
- 通知先はSNSトピック:アラームの通知先はSNSトピックを経由してSlack・メール・PagerDutyに送信する
- 複合アラーム:「CPU使用率90%超かつネットワーク送信量が増加」のような複数条件の組み合わせアラームも設定可能
4. Logs Insightsでログを素早く分析
# Nginxの5XXエラーを時間帯別に集計
fields @timestamp, @message
| filter @message like "HTTP/1.1" 5"
| stats count() as error_count by bin(5m)
| sort @timestamp desc
# Lambda関数のエラーを検索
fields @timestamp, @message
| filter @message like "ERROR"
| sort @timestamp desc
| limit 50📌 この記事のポイント
- EC2のメモリ・ディスクはデフォルト収集されない。CloudWatchエージェントをインストールして収集する
- CPU・ストレージ・5XXエラー・Lambdaエラーの4種類のアラームを最初に必ず設定する
- Logs InsightsのSQLライクなクエリ言語でログを素早く集計・分析できる
キャリアの疑問、一緒に解決しませんか?
Route Bloomでは、インフラ系ITエンジニアを目指す方への個別サポートを行っています。2026年7月からフリーランス講師として本格始動予定です。
ABOUT ME




