【えすえるおー】

SLO(サービスレベル目標) とは?

💡 テストで何点以上取るか決める、サービスの合格ライン
📌 このページのポイント
SLO: サービスの信頼性目標とエラーバジェット 稼働率 時間 → 100% 99.9% ← SLO エラーバジェット(余裕) ← 実績(SLI) SLI で実測 SLO と比較 判定
SLIの実測値をSLO目標と比較し、エラーバジェットを管理する
ひよこ ひよこ

SLOって何のための目標なの?

ペンギン先生 ペンギン先生

サービスがどのくらい安定して動いているべきかを数字で決めるものだよ。たとえば「月間の稼働率99.9%以上」とか「レスポンスタイムの95パーセンタイルが200ms以下」みたいに設定するんだ

ひよこ ひよこ

100%を目標にすればいいんじゃないの?

ペンギン先生 ペンギン先生

実は100%を目指すと莫大なコストがかかるし、新機能のリリースもできなくなるんだ。99.9%と99.99%の差を維持するコストは何倍にもなる。だから適切な目標を設定するのが大事なんだよ

ひよこ ひよこ

SLOを下回ったらどうなるの?

ペンギン先生 ペンギン先生

エラーバジェットという考え方があって、SLOの余裕分を「使える失敗の予算」として管理するんだ。バジェットを使い切ったら新機能リリースを止めて信頼性改善に集中する、というルールを決めているチームが多いよ

ひよこ ひよこ

SLOとSLAって違うの?

ペンギン先生 ペンギン先生

SLAはお客さんとの契約で、SLOを下回ったら返金や補償が発生するんだ。SLOは社内の目標だから罰則はない。普通はSLOをSLAより少し厳しく設定して、SLA違反になる前に気づけるようにするんだよ

ひよこ ひよこ

SLOはどうやって決めればいいの?

ペンギン先生 ペンギン先生

まずSLIで何を測るか決めて、ユーザーが体感で困らないラインを探るんだ。Google SREの本では「ユーザーの幸福度」を基準にすることを推奨しているよ。過去のデータを見て現実的な数値を設定するのがコツだね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
SLOって出てきたら「サービスの信頼性の合格ラインを数字で決めたもの」と思えればだいたいOK!
📖 おまけ:英語の意味
「Service Level Objective」 = サービスレベル目標
💬 Objectiveは「目標」という意味で、サービスが達成すべき信頼性のターゲットを表しているよ
← 用語集にもどる