【レッドメソッド】

REDメソッド とは?

公開:
💡 サービスの「いそがしさ・こわれ具合・のろさ」を3つの数字で見張る監視術。
📌 このページのポイント
REDメソッド — Rate / Errors / Duration マイクロ サービス Rate リクエスト数/秒 例: 350 rps Duration 処理時間 例: p99 = 240ms Errors エラー率 例: 0.3% 3指標でサービスの健全性を把握する
REDメソッドの3指標とマイクロサービスの関係
ひよこ ひよこ
REDメソッドって、なんか色の名前みたいだけど何なの?
ペンギン先生 ペンギン先生
マイクロサービス監視するときに見るべき3つの指標の頭文字を並べたものだよ。Rate(リクエスト数)・Errors(エラー数)・Duration(処理時間)の3つだね。
ひよこ ひよこ
その3つを見ると何がわかるの?
ペンギン先生 ペンギン先生
サービスが「どのくらい忙しいか」「どのくらい壊れているか」「どのくらい遅いか」がわかるんだよ。この3つで大抵の問題は気づけるんだ。
ひよこ ひよこ
じゃあ、それぞれどんなふうに測るの?
ペンギン先生 ペンギン先生
Rateは「1秒あたりのリクエスト数(rps)」、Errorsは「エラーになったリクエストの割合」、Durationは「リクエスト処理にかかった時間(レイテンシ)」で測るよ。PrometheusGrafanaダッシュボードによく並ぶ指標だね。
ひよこ ひよこ
USEメソッドって聞いたことあるけど、REDとどう違うの?
ペンギン先生 ペンギン先生
USEメソッドCPUやメモリなどインフラ側のリソースを診る手法で、REDはAPIやサービス側の振る舞いを診る手法だよ。インフラが原因なのかサービスが原因なのか、両方を組み合わせると問題を素早く切り分けられるんだ。
ひよこ ひよこ
どんな場面で特に役立つの?
ペンギン先生 ペンギン先生
アラートの設計がすごくシンプルになるんだよ。たとえば「Errorが1%を超えたら通知」「Durationの99パーセンタイルが500msを超えたら通知」というルールを各マイクロサービスに統一して設定できる。SREチームがどのサービスも同じ感覚で監視できるのが強みだね。
ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「REDメソッド」って出てきたら「マイクロサービスを3指標で監視するやり方」と思えればだいたいOK!
📖 おまけ:英語の意味
「RED Method」 = レート・エラー・デュレーション方式
💬 Rate(処理率)・Errors(エラー率)・Duration(処理時間)の頭文字を取った造語で、Tom Wilkieが2018年頃に提唱したサービス監視の考え方だよ。
← 用語集にもどる