【テキストトゥビデオ】

Text-to-Video(動画生成AI) とは?

💡 言葉だけで映像が生まれる次世代AI
📌 このページのポイント
テキスト入力 「走る猫」 「草原を駆ける」 プロンプト AI動画生成モデル 拡散モデル / Transformer ▶ 再生 動画出力 複数フレーム生成 数秒〜数分の映像 テキスト記述 → AI解析 → フレーム生成 → 動画合成 代表的サービス: Sora, Runway, Pika など
テキストから動画生成(Text-to-Video)のフロー
ひよこ ひよこ

Text-to-VideoってText-to-Imageとどう違うの?

ペンギン先生 ペンギン先生

Text-to-Imageは1枚の絵を作るけど、Text-to-Videoは動きのある映像を作るんだよ。「海辺を歩く猫」と入力すると、猫が実際に歩いている動画ができあがるんだ。

ひよこ ひよこ

動画を作るほうがずっと難しそうだね。

ペンギン先生 ペンギン先生

そのとおり!画像は1枚だけ整合性を保てばいいけど、動画はフレームごとに動きが自然につながらないといけないんだ。前のコマで右を向いていた人が次のコマで急に左を向いたらおかしいよね。この「時間的な一貫性」を保つのがとても難しいんだよ。

ひよこ ひよこ

Soraってすごいの?

ペンギン先生 ペンギン先生

OpenAIが発表したSoraは、リアルで長めの動画を生成できることで話題になったよ。物理法則をある程度理解していて、物の動きや光の反射が自然に見えるんだ。まだ完璧ではないけど、映像制作の世界を大きく変える可能性がある技術だね。

ひよこ ひよこ

将来は映画もAIで作れるようになるの?

ペンギン先生 ペンギン先生

短い映像なら今でもかなりのクオリティだよ。ただ長編映画のようにストーリーや演技の一貫性を保つのはまだ課題なんだ。将来的にはAIが下書き映像を作って、人間が仕上げるようなワークフローが当たり前になるかもしれないね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「Text-to-Video」って出てきたら「文章を入力すると動画を作ってくれるAI」と思えればだいたいOK!
📖 おまけ:英語の意味
「Text-to-Video」 = テキストから動画へ
💬 Text(文章)をVideo(動画)に変換するという意味。静止画だけでなく動きのある映像まで言葉から生み出せる時代になったんだ
← 用語集にもどる