【こんとろーるねっと】

ControlNet とは?

💡 AIイラストの手綱を握る、構図指定の革命児
📌 このページのポイント
ControlNetによる画像生成の制御 テキスト 「女性が踊る」 制御条件 ポーズ 画像生成モデル (重み凍結) ControlNet (制御ネットワーク) + 生成画像 指定ポーズで 踊る女性の画像 制御条件の種類 ポーズ推定 エッジ検出 深度マップ セグメンテーション
ControlNetのイメージ
ひよこ ひよこ

ControlNetって何ができるの?

ペンギン先生 ペンギン先生

画像生成AIに対して「この構図で描いて」と細かく指定できるようにする技術だよ。たとえば棒人間のポーズを指定して、そのポーズのキャラクターを生成できるんだ

ひよこ ひよこ

テキストで指定するのとは違うの?

ペンギン先生 ペンギン先生

テキストだと「右手を上げて立っている」みたいに書いても、思い通りのポーズにならないことが多いんだ。ControlNetは画像として構図を入力するから、もっと正確に制御できるんだよ

ひよこ ひよこ

ポーズ以外にも使えるのかな?

ペンギン先生 ペンギン先生

もちろんだよ。輪郭線、深度マップ、セグメンテーション、法線マップなど、いろいろな条件で制御できるんだ。部屋の間取りから室内イメージを生成するなんてこともできるよ

ひよこ ひよこ

仕組みはどうなってるの?

ペンギン先生 ペンギン先生

元の画像生成モデルの重みは凍結して変えず、別の制御用ネットワークを並列に追加するんだ。だから元モデルの品質を落とさずに条件制御を追加できる。この設計がControlNetの大きな発明ポイントだよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「ControlNet」って出てきたら「画像生成AIの構図を制御する技術」と思えればだいたいOK!
📖 おまけ:英語の意味
「ControlNet」 = 制御ネットワーク
💬 Control(制御)+ Net(ネットワーク)で、AIを制御するネットワークという意味だよ
← 用語集にもどる