【てきたいてきこうげき】

敵対的攻撃 とは?

💡 人間にはわからない小さなノイズで、AIの判断を狂わせる巧妙な攻撃
📌 このページのポイント
パンダ 98% 微小なノイズ +0.01 -0.03 +0.02 -0.01 人間には 見えない変化 + = テナガザル 99% ✓ AI正解 ✗ AI誤認 人間の目には 全く同じに 見える しかしAIは 完全に誤認 人間には見分けがつかない微小な変化でAIを騙す攻撃手法
敵対的攻撃 ― 人間が気づかない微小なノイズを加えてAIの判定を狂わせる攻撃
ひよこ ひよこ

敵対的攻撃ってなんだか物騒な名前だね。何をする攻撃なの?

ペンギン先生 ペンギン先生

AIをだまして間違った判断をさせる攻撃のことだよ。たとえばパンダの画像にほんの少しだけノイズを加えると、人間にはパンダにしか見えないのに、AIは「テナガザルだ!」と誤認識してしまうんだ。

ひよこ ひよこ

えっ、そんな少しの変化でAIはだまされちゃうの?

ペンギン先生 ペンギン先生

そうなんだ。AIはピクセル一つひとつの数値で判断しているから、人間が気づかないレベルの変化でも結果が大きく変わることがあるんだよ。これが敵対的攻撃の怖いところなんだ。

ひよこ ひよこ

実際に悪用されたら大変じゃない?

ペンギン先生 ペンギン先生

そうだね。たとえば自動運転の車が道路標識を読み間違えたら事故につながるし、セキュリティカメラの顔認識をすり抜けることもできてしまう。だからAIの安全性研究では敵対的攻撃への対策がとても重要なテーマなんだよ。

ひよこ ひよこ

対策はあるの?

ペンギン先生 ペンギン先生

敵対的訓練(Adversarial Training)といって、あらかじめノイズを加えたデータでAIを鍛える方法があるよ。攻撃パターンを事前に学ばせることで、だまされにくいAIを作れるんだ。いたちごっこではあるけど、研究は日々進んでいるよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「敵対的攻撃」って出てきたら「見えないノイズでAIをだます攻撃」と思えればだいたいOK!
📖 おまけ:英語の意味
「Adversarial Attack」 = 敵対的な攻撃
💬 Adversarial(敵対的な)+ Attack(攻撃)。AIと「敵対」して、わざと間違えさせるように仕組まれた攻撃という意味なんだ
← 用語集にもどる