監視（モニタリング）とは何ですか？

システムの稼働状況やパフォーマンスを常時監視し、異常を検知してアラートを出す仕組み。

監視（モニタリング）のポイントは？

メトリクス監視（CPU、メモリ、ディスク使用率）。ログ監視（エラーログの検出）。外形監視（ユーザー視点でサービスの可用性を確認）。Datadog、Prometheus、Grafana、CloudWatch が代表的ツール

【かんし】

監視（モニタリング）とは？

最終更新: 2026年3月27日

💡 システムの「健康診断」を24時間自動で

📌 このページのポイント

メトリクス監視（CPU、メモリ、ディスク使用率）
ログ監視（エラーログの検出）
外形監視（ユーザー視点でサービスの可用性を確認）
Datadog、Prometheus、Grafana、CloudWatch が代表的ツール

モニタリングのイメージ

ひよこ

何を監視するの？

ペンギン先生

大きく3つ。①インフラメトリクス（CPU使用率、メモリ、ディスク、ネットワーク）、②アプリケーションメトリクス（レスポンスタイム、エラー率、リクエスト数）、③ビジネスメトリクス（注文数、売上、アクティブユーザー数）。異常値にはアラート（Slack 通知、PagerDuty）を設定するよ

ひよこ

アラートが多すぎて困る…

ペンギン先生

「アラート疲れ」は深刻な問題だよ。重要度でレベル分け（Critical:電話/SMS、Warning:Slack、Info:ダッシュボードのみ）して、本当にアクションが必要なものだけ通知する。「CPU使用率80%超え」は警告、「サービス応答なし」はCritical。閾値の調整と不要アラートの削除を定期的に行おう

ひよこ

おもしろい！オブザーバビリティって何？

ペンギン先生

監視の進化形で、「メトリクス」「ログ」「トレース」の3本柱でシステムの内部状態を把握する考え方だよ。監視が「何が起きたか」を検知するのに対し、オブザーバビリティは「なぜ起きたか」まで分析できる。分散トレーシング（Jaeger、OpenTelemetry）でマイクロサービス間の問題箇所を特定するんだ

ひよこ

ダッシュボードのコツは？

ペンギン先生

①USE Method（Utilization:使用率、Saturation:飽和度、Errors:エラー）でリソースを整理、②RED Method（Rate:リクエスト率、Errors:エラー率、Duration:処理時間）でサービスを整理、③ダッシュボードは目的別に分ける（概要/詳細/障害対応）。Grafanaでテンプレートを作っておくと新サービスも素早く監視できるよ

まとめ：ざっくりこれだけ覚えればOK！

「モニタリング」って出てきたら「システムの状態を常時監視して異常を検知する仕組み」と思えればだいたいOK！

📖 おまけ：英語の意味

「Monitoring」＝監視

💬 Monitor（監視する）。障害を「起きてから対応」ではなく「起きる前に察知」するための仕組みだよ

← 用語集にもどる

監視（モニタリング） とは？

監視（モニタリング）とは？