【テキストトゥイメージ】

Text-to-Image(画像生成AI) とは?

💡 言葉を絵に変える魔法のAI
📌 このページのポイント
Text-to-Image(テキストから画像生成) テキスト入力 「夕焼けの 海辺の猫」 AI 拡散モデル 生成された画像 プロンプト ノイズ除去を繰り返し生成 高品質な画像が完成 テキストの意味を理解し、対応する画像をゼロから生成する
Text-to-Image(画像生成AI)のイメージ
ひよこ ひよこ

Text-to-Imageってどういう仕組みなの?

ペンギン先生 ペンギン先生

簡単に言うと、AIに「こんな絵を描いて」と文章で指示すると、AIがその文章を理解して画像を生成してくれる技術だよ。たとえば「青い空の下で走る白い馬」と入力すると、そのとおりの絵ができあがるんだ。

ひよこ ひよこ

どうやって文章から絵を作れるの?不思議だね!

ペンギン先生 ペンギン先生

多くのText-to-Imageモデルは「拡散モデル」という技術を使っているよ。ノイズだらけの画像から少しずつノイズを取り除いて、テキストの意味に合った画像を作り出すんだ。大量の画像とテキストのペアで学習しているから、言葉の意味を理解して絵にできるんだよ。

ひよこ ひよこ

Stable DiffusionとかDALL-Eとか色々あるけど何が違うの?

ペンギン先生 ペンギン先生

基本の仕組みは似ているけど、学習データや細かい技術が違うんだ。Stable Diffusionオープンソースで自分のPCでも動かせるし、DALL-EはOpenAIMidjourneyDiscord経由で使えるよ。それぞれ得意な画風や特徴があるから、用途で使い分けるのがおすすめだね。

ひよこ ひよこ

何でも自由に生成していいの?

ペンギン先生 ペンギン先生

そこは注意が必要だよ。他人の著作物に似た画像を生成したり、実在の人物のフェイク画像を作ったりすると問題になるんだ。各サービスには利用規約があるから、ルールを守って楽しく使おうね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「Text-to-Image」って出てきたら「文章を入力すると絵を描いてくれるAI」と思えればだいたいOK!
📖 おまけ:英語の意味
「Text-to-Image」 = テキストから画像へ
💬 Text(文章)をImage(画像)に変換するという意味。人間が言葉で伝えたイメージをAIが絵にしてくれる技術なんだ
← 用語集にもどる