【めとりくす】

メトリクス とは?

💡 数字で見える、システムの健康診断
📌 このページのポイント
メトリクス ― 定量的な指標で状態を可視化 CPU使用率 70% サーバー負荷 応答時間 平均 120ms エラー率 2.1% HTTP 5xx スループット 1,200 req/s 収集 → 集計 → 可視化 → アラート設定 メトリクスがあるから「なんとなく遅い」を数値で議論できる Prometheus, Datadog, CloudWatch などで計測・監視
メトリクスのイメージ
ひよこ ひよこ

サーバーが遅いってユーザーから言われたんだけど、何が原因かわからないよ〜。

ペンギン先生 ペンギン先生

メトリクスは確認した?CPU使用率やメモリ使用量、レスポンスタイムなどの数値データを見れば、どこがボトルネックか見えてくるよ。

ひよこ ひよこ

メトリクスってログとは違うの?

ペンギン先生 ペンギン先生

ログは『何が起きたか』をテキストで記録するもの。メトリクスは『どのくらいか』を数値で記録するものだよ。たとえばログは『エラーが発生しました』、メトリクスは『エラー率が5%です』という感じだね。

ひよこ ひよこ

数値データをどうやって活用するの?

ペンギン先生 ペンギン先生

GrafanaやCloudWatchなどのダッシュボードでグラフ化すると一目瞭然だよ。さらに『CPU使用率が90%を超えたら通知』みたいにアラートを設定すれば、問題が大きくなる前に気づけるんだ。

ひよこ ひよこ

メトリクスってどのくらいの頻度で取るものなの?

ペンギン先生 ペンギン先生

用途による。CPU使用率やメモリは10〜60秒間隔が一般的、ビジネスメトリクス(売上や登録数)は日次〜週次が多いね。Prometheus+Grafanaの構成だと15秒間隔がデフォルトだよ。

ひよこ ひよこ

メトリクスとオブザーバビリティって何が違うの?

ペンギン先生 ペンギン先生

メトリクスはオブザーバビリティ(可観測性)の3本柱の1つだよ。残り2つは「ログ」と「トレース」。メトリクスで異常を検知し、ログで原因を特定し、トレースでリクエストの流れを追う。この3つを組み合わせると「何が起きているか」だけでなく「なぜ起きたか」まで分かるようになるんだ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
メトリクスは、システムの状態を数値で測定・記録するデータです。CPU使用率やレスポンスタイムなどを継続的に収集し、ダッシュボードで可視化することで、問題の早期発見やキャパシティプランニングに役立てます。ログやトレースと合わせてオブザーバビリティの柱となります。
📖 おまけ:英語の意味
「Metrics」 = 測定基準、指標
💬 ギリシャ語のmetron(測定)が語源。複数形で使われることが多く、さまざまな測定値の集合を指す
← 用語集にもどる