【テキストトゥビデオ】
Text-to-Video(動画生成AI) とは?
💡 言葉だけで映像が生まれる次世代AI
📌 このページのポイント
- テキストの指示から数秒〜数十秒の動画をAIが自動生成する
- OpenAIのSoraやRunway Gen-3などが代表的なサービス
- Text-to-Imageの発展形で、時間の流れ(フレーム間の整合性)も考慮する必要がある
- 映像制作・広告・教育など幅広い分野での活用が期待されている
Text-to-VideoってText-to-Imageとどう違うの?
Text-to-Imageは1枚の絵を作るけど、Text-to-Videoは動きのある映像を作るんだよ。「海辺を歩く猫」と入力すると、猫が実際に歩いている動画ができあがるんだ。
動画を作るほうがずっと難しそうだね。
そのとおり!画像は1枚だけ整合性を保てばいいけど、動画はフレームごとに動きが自然につながらないといけないんだ。前のコマで右を向いていた人が次のコマで急に左を向いたらおかしいよね。この「時間的な一貫性」を保つのがとても難しいんだよ。
Soraってすごいの?
将来は映画もAIで作れるようになるの?
まとめ:ざっくりこれだけ覚えればOK!
「Text-to-Video」って出てきたら「文章を入力すると動画を作ってくれるAI」と思えればだいたいOK!
📖 おまけ:英語の意味
「Text-to-Video」 = テキストから動画へ
💬 Text(文章)をVideo(動画)に変換するという意味。静止画だけでなく動きのある映像まで言葉から生み出せる時代になったんだ