【こさいんるいじど】
コサイン類似度 とは?
💡 2つのベクトルの「向きの近さ」で似ている度合いを測る「AIの方向感覚」
📌 このページのポイント
コサイン類似度ってどういう意味?
おもしろい!ユークリッド距離とどう違うの?
ユークリッド距離は「2点間の直線距離」を測るから、ベクトルの長さ(大きさ)に影響されるんだ。コサイン類似度は方向だけを見るから、長さの違いを無視できる。例えば短い文書と長い文書でも、話題が同じなら高い類似度が出るのがコサイン類似度の利点だよ。
どういう場面で使われるの?
コサイン類似度と他の類似度(ユークリッド距離とか)って何が違うの?
まとめ:ざっくりこれだけ覚えればOK!
「コサイン類似度」って出てきたら「2つのベクトルの向きの近さで意味的な類似度を測る指標だな」と思えればだいたいOK!
📖 おまけ:英語の意味
「Cosine Similarity」 = コサインによる類似度
💬 三角関数の「Cosine(コサイン)」を使って2つのベクトルの角度から類似度を計算する。角度が小さいほどコサイン値が大きく(1に近く)なるよ