【べくとる】
ベクトル とは?
💡 意味や特徴を「数字の矢印」で表す道具
📌 このページのポイント
- 大きさと方向を持つ量で、複数の数値のリストとして表される
- AIでは「データの特徴を数値で表したもの」として広く使われる
- ベクトル同士の距離や角度で「似ている・似ていない」を計算できる
- 埋め込み表現やニューラルネットワークの計算の基本単位
ベクトルって学校で習ったやつ?AIとどう関係あるの?
学校で習う「矢印のベクトル」の考え方をもっと拡張したものだよ。AIの世界では「数値のリスト」として使われる。例えば「猫」という単語を[0.2, 0.8, -0.3, 0.5, ...]という数百個の数値で表すのが埋め込みベクトルなんだ。
おもしろい!ベクトルで「似ている・似ていない」がわかるの?
コサイン類似度という計算を使うんだ。ベクトルの向きが揃っている(角度が小さい)ほど似ている、と判断するんだよ。「犬」と「猫」のベクトルは向きが近くて「猫」と「車」のベクトルは向きが遠い、という具合に意味の近さが角度に現れるんだ。
ベクトルデータベースって普通のデータベースと何が違うの?
普通のデータベースは「名前が〇〇のレコードを検索して」みたいな完全一致や条件検索が得意だよね。ベクトルデータベースは「このベクトルに近いものを検索して」という近似最近傍探索が得意なんだ。意味的に似た文章を検索するのに使われるよ。
高次元ベクトルって「距離の感覚」がおかしくなるって聞いたんだけど?
「次元の呪い」という有名な問題だよ。低次元(2D・3D)では「近い点」と「遠い点」がはっきり分かれる。でも高次元になると、すべての点が互いに「だいたい同じくらい遠い」という現象が起きるんだ。1000次元の空間でランダムにサンプルした点同士の距離は、驚くほど均一になってしまう。AI研究では数百〜数千次元のベクトルを使うから、「距離が近い = 似ている」という直感が崩れやすく、類似度の指標選びや次元削減の方法がとても重要になるんだよ。
まとめ:ざっくりこれだけ覚えればOK!
「ベクトル」って出てきたら「AIがデータの特徴を数値のリストで表したもの」と思えればだいたいOK!
📖 おまけ:英語の意味
「vector」 = 運ぶもの・方向
💬 ラテン語の「vehere(運ぶ)」から来ていて、数学では「方向と大きさを持つ量」を指す。高校数学でも出てくる概念だよ