【こんぽんげんいんぶんせき】

根本原因分析(RCA) とは?

💡 「モグラ叩き」をやめて「巣穴」を見つける問題解決法
📌 このページのポイント
根本原因分析 ― 表面から根本へ掘り下げる 表面的な対処(対症療法) サーバーを再起動した → また同じ障害が再発… モグラ叩き状態 根本原因分析(RCA) なぜなぜ分析 / FTA 特性要因図 / パレート図 → 根っこを見つけて再発防止 掘り下げの例 症状: サーバーダウン 直接原因: ディスク容量不足 根本原因: ログローテーション未設定 + 監視の欠如 「何が悪い」を探して仕組みで再発を防ぐ
根本原因分析のイメージ
ひよこ ひよこ

根本原因分析って、普通に原因を調べるのとどう違うの?

ペンギン先生 ペンギン先生

たとえばサーバーがダウンしたとき、「ディスクがいっぱいだったから」で終わるのが表面的な分析。「なぜディスクがいっぱいになったのか」「なぜ監視で気づけなかったのか」まで掘り下げるのが根本原因分析だよ

ひよこ ひよこ

どうやって根っこを見つけるの?

ペンギン先生 ペンギン先生

代表的なのは「なぜ?」を5回繰り返すなぜなぜ分析、原因を魚の骨のように整理する特性要因図、論理的に分解するFTAなどがあるよ。状況に応じて使い分けるんだ

ひよこ ひよこ

根本原因って1つだけ?

ペンギン先生 ペンギン先生

実は複数あることが多いよ。技術的な原因、プロセスの問題、組織の問題が複合的に絡んでいるケースがほとんどだね。だから「誰が悪い」ではなく「何が悪い」を探す姿勢が大事なんだ

ひよこ ひよこ

開発チームではどんなときに使うの?

ペンギン先生 ペンギン先生

本番障害のポストモーテム(事後分析)は定番だね。あとはリリース遅延が繰り返されるとか、同じ種類のバグが何度も出るとか、「また同じ問題が起きた」と感じたら根本原因分析の出番だよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「根本原因分析」って出てきたら「問題の本当の原因を見つけて再発を防ぐ手法」と思えればだいたいOK!
📖 おまけ:英語の意味
「Root Cause Analysis」 = 根本原因分析
💬 root(根っこ)+ cause(原因)で、問題の「根っこ」を掘り当てるというイメージだよ
← 用語集にもどる