【せんたくばいあす】
選択バイアス とは?
💡 誰に聞いたかで答えが変わる
📌 このページのポイント
- 調査対象の選び方がランダムでないときに結果が偏る現象
- 生存バイアスや自己選択バイアスなど多くのサブタイプがある
- AIの学習データにおいても頻繁に問題となる
- ランダム化比較試験や層化サンプリングで軽減できる
選択バイアスって統計的バイアスとどう違うの?
統計的バイアスは大きなカテゴリで、その中の一種が選択バイアスだよ。データを集める段階で対象の選び方が偏っているときに起こるバイアスのことだね
具体的にはどんな例があるの?
たとえばアプリのユーザー満足度調査で、わざわざアンケートに答えてくれる人はそのアプリが好きな人が多いよね。不満で辞めた人は回答しない。これが自己選択バイアスだよ。結果が実態より良く見えてしまうんだ
AIの学習データでも起こるの?
生存バイアスってよく聞くけどこれも仲間?
そうだよ。生存バイアスは選択バイアスの代表的なサブタイプで、成功例や残ったものだけを見て判断してしまうこと。成功した起業家だけ取材して「大学中退が成功の秘訣」と結論づけるのは、中退して失敗した大多数を無視しているよね。データ分析では脱落したレコードにも注意を払うのが鉄則だよ
まとめ:ざっくりこれだけ覚えればOK!
選択バイアスって出てきたら「サンプルの選び方が偏ったせいで結論がズレること」と思えればだいたいOK!
📖 おまけ:英語の意味
「Selection Bias」 = 選択の偏り
💬 第二次世界大戦中に帰還した爆撃機の被弾箇所だけを補強しようとした話が有名で、帰れなかった機体を無視しているという典型的な生存バイアス(選択バイアスの一種)だよ