【えすかれーしょんぽりしー】

エスカレーションポリシー とは?

💡 つながらなくても大丈夫、次の人に自動バトンタッチ
📌 このページのポイント
エスカレーションポリシーの仕組み アラート発生 障害検知 Level 1 当番エンジニア 通知: Slack/電話 15分 応答なし Level 2 チームリーダー 通知: 電話/SMS 30分 応答なし Level 3 CTO/経営層 全手段で通知 深刻度によってエスカレーション先が変わる Sev1(重大障害)→ Level 3 まで即時 / Sev3(軽微)→ Level 1 のみ PagerDuty / OpsGenie などのツールで自動化
段階的にエスカレーションされる仕組み
ひよこ ひよこ

エスカレーションポリシーって、学校の連絡網みたいなもの?

ペンギン先生 ペンギン先生

まさにそんなイメージだよ!「まずAさんに電話、15分出なかったらBさん、それでもダメならCさん」みたいに順番が決まっているんだ。

ひよこ ひよこ

全部の障害で同じ連絡先に通知するの?

ペンギン先生 ペンギン先生

障害の深刻度によって変えるのが一般的だよ。軽いものはチームリーダーまで、重大障害はCTOや経営層まで一気にエスカレーションされる仕組みだね。

ひよこ ひよこ

手動で電話するの?

ペンギン先生 ペンギン先生

今はPagerDutyやOpsGenieといったツールが自動で通知してくれるよ。電話、SMS、Slackなど複数の手段で連絡して、応答がなければ自動的に次の人に回すんだ。

ひよこ ひよこ

ポリシーを作るときのコツってある?

ペンギン先生 ペンギン先生

タイムアウト時間を短くしすぎない」「休日や深夜のローテーションも考慮する」「定期的に連絡先を見直す」の3つが大事だよ。退職した人が残ったままだと誰にも届かなくなるからね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「エスカレーションポリシー」って出てきたら「障害時の連絡網ルール」と思えればだいたいOK!
📖 おまけ:英語の意味
「Escalation Policy」 = 段階的上申ルール
💬 escalationは「段階的に上げる」という意味で、最初の担当者で解決できなければ次の人へ、それでもダメならさらに上へと段階的に引き上げていく仕組みだよ。
← 用語集にもどる