【せいかいりつ】

正解率 とは?

💡 全問中の正解数の割合を示す「AIのテストの点数」
📌 このページのポイント
正解率(Accuracy)と混同行列 混同行列(Confusion Matrix) 予測結果 陽性 陰性 実際 陽性 陰性 TP 真陽性 FN 偽陰性 FP 偽陽性 TN 真陰性 緑 = 正解(TPとTN) 正解率の計算式 TP + TN TP + FP + FN + TN = 正しく分類できた割合 値は 0〜1(または 0%〜100%) 例: 100枚の画像を「猫 or 犬」で分類 TP=40(猫を猫と正解)+ TN=35(犬を犬と正解)= 75/100 → 正解率 75% 注意: データの偏りがあると正解率だけでは不十分(適合率・再現率も確認) 正解(TP/TN) 不正解(FP/FN)
正解率のイメージ
ひよこ ひよこ

正解率が高いモデルが一番いいってことでしょ?

ペンギン先生 ペンギン先生

残念ながら違うんだ。たとえばがんの検査で、患者100人のうち1人しかがんじゃない場合、全員「正常」と答えるだけで正解率99%になる。でもそのモデルは唯一のがん患者を見逃してるから最悪のモデルだよね。

ひよこ ひよこ

じゃあ正解率を見ても意味ないの?

ペンギン先生 ペンギン先生

クラスが均衡していてどの間違いも同じコストなら正解率は有効だよ。「猫・犬・鳥を均等に1000枚ずつ分類する」みたいなケースね。問題はデータが偏っているときと、間違いの種類によってコストが違うときなんだ。

ひよこ ひよこ

何を見れば正解率の罠を回避できるの?

ペンギン先生 ペンギン先生

混同行列(Confusion Matrix)を見るのが基本だよ。「何を何と間違えたか」の内訳が全部分かるから、正解率の裏に隠れた問題を見つけられる。そこから適合率再現率F1スコアを計算して判断するんだ。

ひよこ ひよこ

マクロ平均とマイクロ平均って何が違うの?

ペンギン先生 ペンギン先生

多クラス分類で複数クラスの正解率をまとめるときの集計方法の違いなんだ。マクロ平均はクラスごとに正解率を計算してから単純平均するから、少数クラスを重視した評価になる。マイクロ平均は全クラスの正解数と全件数を足してから割るから、多数クラスの影響が大きい評価になる。少数クラスの見落としを防ぎたい医療診断ならマクロ平均を見るべきだし、全体的なスループットを重視するならマイクロ平均を見るべき、というようにビジネス目的によって使い分けが必要なんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「正解率」って出てきたら「全件のうち正しく予測できた割合のことで、高くても油断禁物なAI評価指標だな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Accuracy」 = 正確さ・精度
💬 「正確さ」を表す日常英語。機械学習では「全データに対する正解の割合」という技術的な意味で使われるよ
← 用語集にもどる