【こんどうぎょうれつ】

混同行列 とは?

💡 正解と予測の組み合わせを全パターン並べた「間違い方の全記録」
📌 このページのポイント
混同行列 予測: 陽性 予測: 陰性 実際: 陽性 実際: 陰性 TP 真陽性 FN 偽陰性 FP 偽陽性 TN 真陰性 適合率 (Precision) TP / (TP + FP) 再現率 (Recall) TP / (TP + FN)
混同行列の見方
ひよこ ひよこ

混同行列って何で「混同」するの?

ペンギン先生 ペンギン先生

モデルがクラスを混同(取り違え)した結果を表にしているからだよ。たとえば「猫を犬と間違えた」「犬を猫と間違えた」という取り違えのパターンを全部記録した表が混同行列なんだ。

ひよこ ひよこ

TP・FP・FN・TNってどういう意味?

ペンギン先生 ペンギン先生

「陽性(Positive)と予測したか」「実際に陽性か」の組み合わせだよ。TP(真陽性)は陽性と予測して実際も陽性、FP(偽陽性)は陽性と予測したが実際は陰性、FN(偽陰性)は陰性と予測したが実際は陽性、TN(真陰性)は陰性と予測して実際も陰性。最初のTとFが「予測が合っているか」、次のPとNが「何と予測したか」を表しているよ。

ひよこ ひよこ

医療診断ならどのセルを特に気にすべきなの?

ペンギン先生 ペンギン先生

FN(偽陰性)、つまり「病気なのに正常と診断する」のが一番危険だよ。見逃しは命に関わることがある。だからFNを減らす「再現率(感度)」を最重視するんだ。一方でFP(偽陽性)、つまり「正常なのに病気と診断する」は不安や不必要な検査につながるけど、FNよりはマシとされることが多いね。

ひよこ ひよこ

多クラス分類の混同行列ってどう読むの?

ペンギン先生 ペンギン先生

多クラスだと3×3や4×4の行列になって読み解くのが難しくなるんだ。対角線上のセルが正解で、そこから外れたセルが間違い。「どのクラスとどのクラスが混同されやすいか」を見るのがポイントで、たとえば「3と8がよく間違われる」「白猫と白犬が混同されやすい」といったインサイトが得られる。この混同のパターンを見てモデルを改善する(データを追加する、特徴量を見直す)のがデータサイエンティストの実務の醍醐味なんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「混同行列」って出てきたら「AIが何をどう間違えたかを全パターン表にした評価ツールのことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Confusion Matrix」 = 混同(誤分類)の行列
💬 モデルが「混同(Confuse)」した結果を整理した行列(Matrix)という意味だよ。Confusionには「混乱」という意味もあるね
← 用語集にもどる