【ステーブルディフュージョン】
Stable Diffusion とは?
💡 言葉を絵に変える「AIの画家」
📌 このページのポイント
どうやって文章から絵を描くの?
ざっくり言うと「ノイズだらけの画像からノイズを少しずつ取り除く」ことで画像を作るんだ。テキストの情報を手がかりにして「この言葉に合うようにノイズを除去しろ」と指示することで、説明文に合った画像が生まれるよ。
MidjourneyとかDALL-Eとの違いは?
最大の違いはオープンソースかどうかだよ。Stable Diffusionはモデルの重みが公開されていて、自分のPCで動かせるし、自由に改造できる。MidjourneyやDALL-Eはクラウドサービスとして使うもので、モデル自体は非公開なんだ。
LoRAって何?
Low-Rank Adaptationの略で、少ないデータと計算量でモデルを追加学習させる技術だよ。例えば特定の画風やキャラクターの画像を数十枚学習させるだけで、そのスタイルの画像を生成できるようになる。Stable Diffusionのコミュニティではとても人気の手法なんだ。
Stable Diffusionを自分のPCで動かすにはどんなスペックが必要なの?
著作権的には大丈夫なの?
これは現在進行形の法的議論だよ。Stability AI(開発元)に対してアーティストが集団訴訟を起こしている。学習データに無断で使われた著作物の権利が争点。商用利用する場合はライセンス条項を確認し、特定のアーティストの画風を意図的に模倣するような生成は法的リスクが高いことを理解しておくべきだよ。技術の進歩と法整備が追いかけっこしている状態なんだ。
📖 おまけ:英語の意味
「Stable Diffusion」 = 安定した拡散
💬 「Stable」は安定した、「Diffusion」は拡散を意味する。ノイズを拡散・除去する学習プロセスを安定的に行う技術という意味だよ