【ぽすともーてむ】

ポストモーテム とは?

💡 障害から学び、同じ失敗を繰り返さないための振り返り会
📌 このページのポイント
ポストモーテム ― インシデント振り返りのフロー ① 障害発生 インシデント を検知・対応 ② 事実整理 タイムラインを 時系列で記録 ③ 原因分析 根本原因を 深掘り(5 Whys) ④ 再発防止 改善策を 策定 ⑤ 共有 チーム・ 組織に展開 ポストモーテム文書の構成 概要 影響範囲・時間 タイムライン 時系列の経緯 根本原因 技術的な原因 改善アクション 担当者・期限付きのToDoリスト 重要: 個人を責めない文化 Blameless(非難しない)が原則
ポストモーテム(インシデント振り返り)のフローのイメージ
ひよこ ひよこ

ポストモーテムって反省会と何が違うの?

ペンギン先生 ペンギン先生

最大の違いは「個人を責めない」というルールがあること。Blameless(非難なし)が原則で、「Aさんがミスした」ではなく「なぜミスが起きる仕組みだったか」に注目するんだ

ひよこ ひよこ

具体的にどういうことを書くの?

ペンギン先生 ペンギン先生

主な項目は「何が起きたか(タイムライン)」「影響範囲」「根本原因(Root Cause)」「うまくいったこと」「改善すべきこと」「再発防止のアクションアイテム」だよ。時系列で事実を整理するのが大事だね

ひよこ ひよこ

いつやるべきなの?

ペンギン先生 ペンギン先生

障害が収束してから1〜3日以内が理想的だね。時間が経つと記憶が薄れるし、ログも消えたりする。でも障害直後は疲れているから、少し落ち着いてからの方が建設的な議論ができるよ

ひよこ ひよこ

有名な企業のポストモーテムって読めるの?

ペンギン先生 ペンギン先生

GoogleGitHubCloudflareなど多くのテック企業が障害のポストモーテムを公開しているよ。Googleの「SRE本」にはポストモーテムの書き方が詳しく載っていて、業界のベストプラクティスになってるんだ。他社の障害から学べる貴重な資料だね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「ポストモーテム」って出てきたら「障害のあとに原因と対策をまとめる振り返り」と思えればだいたいOK!
📖 おまけ:英語の意味
「Postmortem」 = 事後検証・死後検査
💬 ラテン語の「post(後)+ mortem(死)」から来ていて、もともと医学の「検死」の意味。IT分野では障害の「事後検証」として使われるよ
← 用語集にもどる