【がん(てきたいてきせいせいねっとわーく)】

GAN(敵対的生成ネットワーク) とは?

💡 「偽造師」と「鑑定士」が競い合って上達する生成AI
📌 このページのポイント
ノイズ 生成器 Generator 偽データ 本物 識別器 Discriminator 本物?偽物? 判定 フィードバック 生成器と識別器が競い合い、生成品質が向上する
GANの仕組み
ひよこ ひよこ

GANってどんな仕組みなの?

ペンギン先生 ペンギン先生

警察と偽造師のゲームで考えると分かりやすいよ。偽造師(生成器)は「本物そっくりの偽札」を作ろうとする。警察(識別器)は「本物か偽物か」を見抜こうとする。二つが競い合う中で偽造師はどんどん上手くなり、警察も目が肥えていく。その結果、最終的には本物と見分けがつかない偽物を作れるようになるんだよ。

ひよこ ひよこ

どんなことに使われてきたの?

ペンギン先生 ペンギン先生

解像度の画像を高解像度に変換する超解像、存在しない人の顔写真を生成するFace Generation、絵画のスタイルを別の絵画のタッチに変換するスタイル転送など、様々な画像処理に使われてきたよ。ディープフェイク動画の生成にもGANが使われていて、社会的な問題にもなっているんだ。

ひよこ ひよこ

拡散モデルに主役を取られたって聞いたけど?

ペンギン先生 ペンギン先生

GANは「モード崩壊」という問題を抱えていてね。生成器が特定のパターンの画像だけを作ることで識別器を騙せると学習してしまう現象なんだ。また学習が不安定になりやすくて、パラメータのバランスを保つのが難しい。拡散モデルはこれらの問題が少なく学習が安定しているから、高品質画像生成では拡散モデルが主流になってきたんだよ。

ひよこ ひよこ

GANの学習ってどうやってバランスを保つの?

ペンギン先生 ペンギン先生

これがGANの本当に難しいところでね。生成器識別器の強さが釣り合っていないと学習が崩れるんだ。識別器が強すぎると生成器が全く学べない。生成器が強すぎると識別器がただの定数出力になる。この均衡(ナッシュ均衡)に収束させるための学習率損失関数の設計はとても難しくて、「理論的には収束するはずなのに実際の学習では発散する」という問題に当たることが多い。GANの学習安定化の研究は今でも続いていて、特殊なアーキテクチャや学習テクニックを組み合わせることで対処するのが現実なんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「GAN」って出てきたら「偽造師と鑑定士を競わせてリアルな画像を作る技術」と思えればだいたいOK!
📖 おまけ:英語の意味
「Generative Adversarial Network」 = 敵対的生成ネットワーク
💬 Adversarial(敵対的)が特徴で、二つのネットワークがお互いに「敵」として競い合う仕組みを表しているよ。2014年にIan Goodfellowが提案した
← 用語集にもどる