【せんざいべくとる】

潜在ベクトル とは?

💡 データの本質をギュッと圧縮した、見えない特徴の座標
📌 このページのポイント
潜在ベクトルと潜在空間 元データ(高次元) 圧縮 潜在ベクトル 0.3 -1.2 0.8 ... 復元 復元データ 潜在空間 似たデータは近くに集まる ベクトル演算の例 + 女王 潜在空間では意味的な足し算・引き算ができる
潜在ベクトルによるデータ圧縮と潜在空間のイメージ
ひよこ ひよこ

潜在ベクトルって、何が潜在してるの?

ペンギン先生 ペンギン先生

たとえば顔写真を考えてみて。ピクセルの数値そのものからは分かりにくいけど、「笑顔かどうか」「髪の長さ」「肌の色」といった特徴が裏に隠れているよね。その隠れた特徴を数値の列として表したのが潜在ベクトルだよ

ひよこ ひよこ

圧縮するとデータが壊れたりしないの?

ペンギン先生 ペンギン先生

多少の情報は落ちるけど、本質的な特徴は保たれるんだ。たとえば512x512の画像は何十万ものピクセル値だけど、潜在ベクトルなら数百個の数値で表現できる。そこからデコーダーで元の画像を復元できるんだよ

ひよこ ひよこ

Stable Diffusionでも使われてるの?

ペンギン先生 ペンギン先生

まさに中核技術だよ。Stable Diffusionピクセル空間ではなく潜在空間でノイズ除去を行う「Latent Diffusion Model」という仕組みで、だから高解像度でも高速に画像生成できるんだ

ひよこ ひよこ

ベクトルの足し算で意味を操作できるって本当?

ペンギン先生 ペンギン先生

有名な例がWord2Vecの「王 − 男 + 女 = 女王」だね。画像でも同じことができて、笑顔の潜在ベクトルの方向を足すと無表情の顔が笑顔になったりする。潜在空間が意味的に整理されているからこそできる芸当で、これが生成AIの編集機能の基盤になっているんだよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「潜在ベクトル」って出てきたら「データの特徴を圧縮した数値の列」と思えればだいたいOK!
📖 おまけ:英語の意味
「Latent Vector」 = 潜在ベクトル
💬 Latentは隠れた・潜在的なという意味で、データの表面には見えないけれど内部に潜んでいる本質的な特徴を数値化したベクトルという意味だよ
← 用語集にもどる