【えふてぃーえー】

FTA(故障の木解析) とは?

💡 不具合の「家系図」をたどって真犯人を突き止める
📌 このページのポイント
FTA ― 故障の木解析 サービス停止 OR サーバー障害 AND メイン故障 バックアップ故障 ネットワーク障害 OR 回線切断 DNS障害 OR: いずれか発生で上位事象発生 / AND: すべて同時に発生で上位事象発生
FTA(故障の木解析)のイメージ
ひよこ ひよこ

FTAって、FMEAとどう違うの?

ペンギン先生 ペンギン先生

FMEAは部品ごとに「どう壊れるか」をボトムアップで考えるけど、FTAは「この大きな障害が起きた」というゴールから逆算してトップダウンで原因をたどるんだよ。方向が逆なんだね

ひよこ ひよこ

木構造ってどんな感じ?

ペンギン先生 ペンギン先生

一番上に「サービスが停止した」みたいなトップ事象を置いて、その下に「サーバーダウン」「ネットワーク障害」みたいな原因をぶら下げるんだ。ORゲートなら「どれか1つでも起きたら発生」、ANDゲートなら「全部同時に起きたら発生」という意味だよ

ひよこ ひよこ

確率の計算もできるの?

ペンギン先生 ペンギン先生

そうだよ。末端の基本事象に発生確率を設定すれば、ORゲートは足し算、ANDゲートは掛け算で上位の確率を計算できる。定量的にリスクを評価できるのがFTAの強みだね

ひよこ ひよこ

ソフトウェアだとどんな場面で使う?

ペンギン先生 ペンギン先生

大規模障害の事後分析(ポストモーテム)でよく使われるよ。「本番サービスが30分停止した」というトップ事象から、デプロイ手順のミス、監視の漏れ、フェイルオーバーの失敗みたいに原因を構造化して、再発防止策を導き出すんだ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「FTA」って出てきたら「不具合の原因を木構造で上から下にたどる分析手法」と思えればだいたいOK!
📖 おまけ:英語の意味
「Fault Tree Analysis」 = 故障の木解析
💬 1960年代にベル研究所がミサイルの安全性評価のために開発した手法なんだよ
← 用語集にもどる