【エンベディングモデル】
Embeddingモデル とは?
💡 言葉を数字の地図に変える翻訳者。意味が近いものは近くに置いてくれる
📌 このページのポイント
Embeddingモデルって、普通のAIモデルとは違うの?
数値に変換して何が嬉しいの?
たとえば「犬が走る」と「ワンちゃんが駆ける」は文字が全然違うけど、Embeddingすると近いベクトルになる。つまり意味の近さをコンピュータが計算できるようになるんだよ
どのモデルを選べばいいの?
次元数が大きいほど良いの?
次元が多いほど表現力は上がるけど、ストレージとの検索速度のトレードオフがある。実は768次元くらいで十分なケースが多いんだ。Matryoshka Embeddingという技術を使えば、あとから次元を削っても精度が落ちにくいモデルもあるよ
まとめ:ざっくりこれだけ覚えればOK!
「Embeddingモデル」って出てきたら「データを意味を保った数値ベクトルに変える変換器」と思えればだいたいOK!
📖 おまけ:英語の意味
「Embedding Model」 = 埋め込みモデル
💬 「embed(埋め込む)」から来ていて、言葉の意味を数値空間に「埋め込む」イメージだよ