【でーたぽいずにんぐ】

データポイズニング とは?

💡 AIの「教科書」に毒を仕込んで、間違いを学ばせる攻撃
📌 このページのポイント
データポイズニングの仕組み 正常な学習データ 正しいラベル ✓ + 汚染データ 猫 → 犬 ☠ 犬 → 猫 ☠ 偽のラベル ✗ AI学習 モデル訓練 誤った判断 をするモデル 猫の画像→ 「これは犬」✗ ポイズニングの影響 正常なモデル 猫の画像 → 「猫」 ✓ 正解 汚染されたモデル 猫の画像 → 「犬」 ✗ 不正解 vs
データポイズニングのイメージ
ひよこ ひよこ

データポイズニングって怖い名前…。データに毒を入れるってどういうこと?

ペンギン先生 ペンギン先生

AIの訓練データにわざと間違った情報を混ぜる攻撃のことだよ。たとえば犬の画像に「猫」というラベルを大量に紛れ込ませると、AIは犬を見ても猫と判断するようになってしまうんだ。

ひよこ ひよこ

でも訓練データって管理されてるんじゃないの?

ペンギン先生 ペンギン先生

大量のデータをインターネットから自動収集することが多いから、そこに悪意あるデータを紛れ込ませる余地があるんだ。何百万件もあるデータの中から汚染されたものを見つけるのはとても大変なんだよ。

ひよこ ひよこ

敵対的攻撃とは何が違うの?

ペンギン先生 ペンギン先生

いい質問だね!敵対的攻撃はAIを使うとき(推論時)に入力データを細工するけど、データポイズニングはAIを作るとき(訓練時)にデータを汚染するんだ。つまり攻撃のタイミングが違うんだよ。

ひよこ ひよこ

どうやって防げばいいの?

ペンギン先生 ペンギン先生

訓練データの品質チェックを徹底したり、異常なデータを自動検出する仕組みを入れたりするのが基本的な対策だよ。また、データの出所を追跡できるようにすることも重要なんだ。AI開発では「良いデータを集めること」が何より大切だということだね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「データポイズニング」って出てきたら「AIの訓練データに毒を入れて誤動作させる攻撃」と思えればだいたいOK!
📖 おまけ:英語の意味
「Data Poisoning」 = データの毒入れ
💬 Data(データ)+ Poisoning(毒を盛ること)。AIが学ぶ「教科書」に毒を仕込むというイメージから名付けられた攻撃手法なんだ
← 用語集にもどる