【レッドメソッド】

REDメソッド とは?

💡 サービスの「いそがしさ・こわれ具合・のろさ」を3つの数字で見張る監視術。
📌 このページのポイント
REDメソッド — Rate / Errors / Duration マイクロ サービス Rate リクエスト数/秒 例: 350 rps Duration 処理時間 例: p99 = 240ms Errors エラー率 例: 0.3% 3指標でサービスの健全性を把握する
REDメソッドの3指標とマイクロサービスの関係
ひよこ ひよこ

REDメソッドって、なんか色の名前みたいだけど何なの?

ペンギン先生 ペンギン先生

マイクロサービス監視するときに見るべき3つの指標の頭文字を並べたものだよ。Rate(リクエスト数)・Errors(エラー数)・Duration(処理時間)の3つだね。

ひよこ ひよこ

その3つを見ると何がわかるの?

ペンギン先生 ペンギン先生

サービスが「どのくらい忙しいか」「どのくらい壊れているか」「どのくらい遅いか」がわかるんだよ。この3つで大抵の問題は気づけるんだ。

ひよこ ひよこ

じゃあ、それぞれどんなふうに測るの?

ペンギン先生 ペンギン先生

Rateは「1秒あたりのリクエスト数(rps)」、Errorsは「エラーになったリクエストの割合」、Durationは「リクエスト処理にかかった時間(レイテンシ)」で測るよ。PrometheusGrafanaダッシュボードによく並ぶ指標だね。

ひよこ ひよこ

USEメソッドって聞いたことあるけど、REDとどう違うの?

ペンギン先生 ペンギン先生

USEメソッドCPUやメモリなどインフラ側のリソースを診る手法で、REDはAPIやサービス側の振る舞いを診る手法だよ。インフラが原因なのかサービスが原因なのか、両方を組み合わせると問題を素早く切り分けられるんだ。

ひよこ ひよこ

どんな場面で特に役立つの?

ペンギン先生 ペンギン先生

アラートの設計がすごくシンプルになるんだよ。たとえば「Errorが1%を超えたら通知」「Durationの99パーセンタイルが500msを超えたら通知」というルールを各マイクロサービスに統一して設定できる。SREチームがどのサービスも同じ感覚で監視できるのが強みだね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「REDメソッド」って出てきたら「マイクロサービスを3指標で監視するやり方」と思えればだいたいOK!
📖 おまけ:英語の意味
「RED Method」 = レート・エラー・デュレーション方式
💬 Rate(処理率)・Errors(エラー率)・Duration(処理時間)の頭文字を取った造語で、Tom Wilkieが2018年頃に提唱したサービス監視の考え方だよ。
← 用語集にもどる