【べくとる】

ベクトル とは?

💡 意味や特徴を「数字の矢印」で表す道具
📌 このページのポイント
ベクトル — 方向と大きさを持つ量 x y a = (3, 2) b = (2, 0.5) IT分野での活用 自然言語処理(NLP) 単語をベクトルで表現 画像認識 特徴量をベクトル化 レコメンド 類似度をベクトル間距離で計算 ベクトルの向きが近い = 意味が似ている(コサイン類似度)
ベクトルの概念とIT分野での活用
ひよこ ひよこ

ベクトルって学校で習ったやつ?AIとどう関係あるの?

ペンギン先生 ペンギン先生

学校で習う「矢印のベクトル」の考え方をもっと拡張したものだよ。AIの世界では「数値のリスト」として使われる。例えば「猫」という単語を[0.2, 0.8, -0.3, 0.5, ...]という数百個の数値で表すのが埋め込みベクトルなんだ。

ひよこ ひよこ

おもしろい!ベクトルで「似ている・似ていない」がわかるの?

ペンギン先生 ペンギン先生

コサイン類似度という計算を使うんだ。ベクトルの向きが揃っている(角度が小さい)ほど似ている、と判断するんだよ。「犬」と「猫」のベクトルは向きが近くて「猫」と「車」のベクトルは向きが遠い、という具合に意味の近さが角度に現れるんだ。

ひよこ ひよこ

ベクトルデータベースって普通のデータベースと何が違うの?

ペンギン先生 ペンギン先生

普通のデータベースは「名前が〇〇のレコードを検索して」みたいな完全一致や条件検索が得意だよね。ベクトルデータベースは「このベクトルに近いものを検索して」という近似最近傍探索が得意なんだ。意味的に似た文章を検索するのに使われるよ。

ひよこ ひよこ

高次元ベクトルって「距離の感覚」がおかしくなるって聞いたんだけど?

ペンギン先生 ペンギン先生

「次元の呪い」という有名な問題だよ。低次元(2D・3D)では「近い点」と「遠い点」がはっきり分かれる。でも高次元になると、すべての点が互いに「だいたい同じくらい遠い」という現象が起きるんだ。1000次元の空間でランダムにサンプルした点同士の距離は、驚くほど均一になってしまう。AI研究では数百〜数千次元のベクトルを使うから、「距離が近い = 似ている」という直感が崩れやすく、類似度の指標選びや次元削減の方法がとても重要になるんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「ベクトル」って出てきたら「AIがデータの特徴を数値のリストで表したもの」と思えればだいたいOK!
📖 おまけ:英語の意味
「vector」 = 運ぶもの・方向
💬 ラテン語の「vehere(運ぶ)」から来ていて、数学では「方向と大きさを持つ量」を指す。高校数学でも出てくる概念だよ
← 用語集にもどる