【ハイブリッドけんさく】

ハイブリッド検索 とは?

💡 辞書引きと空気読み、両方できる検索のいいとこ取り戦略
📌 このページのポイント
ハイブリッド検索: 2つの検索方式を融合 検索クエリ キーワード検索(BM25) ✓ 固有名詞・型番に強い ✓ 完全一致が得意 ✗ 言い換え・同義語に弱い スコア: TF-IDF ベクトル検索 ✓ 意味の類似性に強い ✓ 言い換え・同義語OK ✗ 固有名詞の一致が苦手 スコア: コサイン類似度 RRFで統合ランキング
ハイブリッド検索の仕組み: キーワード検索とベクトル検索の長所を融合
ひよこ ひよこ

ベクトル検索だけじゃダメなの?わざわざ組み合わせる理由は?

ペンギン先生 ペンギン先生

ベクトル検索は意味の近さで探すから、「iPhone 15 Pro Max」みたいな固有名詞の完全一致が苦手なんだ。逆にキーワード検索は「スマホの最新おすすめ」みたいな曖昧な質問が苦手。両方使えば弱点を補い合えるんだよ

ひよこ ひよこ

2つの検索結果ってどうやって混ぜるの?

ペンギン先生 ペンギン先生

Reciprocal Rank Fusion(RRF)という手法がよく使われるよ。それぞれの検索結果の順位を数式で合算して、最終的なランキングを決めるんだ。重み付けを調整して、どちらの検索をどれだけ重視するかチューニングできるよ

ひよこ ひよこ

実際にどのツールで使えるの?

ペンギン先生 ペンギン先生

Weaviateは最初からハイブリッド検索をサポートしているし、Elasticsearchも8.xからkNN検索とBM25を組み合わせられる。Qdrantもfusion機能を持っているよ

ひよこ ひよこ

RAGに使うときのコツってある?

ペンギン先生 ペンギン先生

alphaパラメータ(キーワード vs ベクトル重み)の調整が重要だね。ドメインによって最適値が違うから、評価データセットを作ってチューニングするのがベストプラクティスだよ。最近はリランカーを後段に挟んでさらに精度を上げる構成も定番になってきたね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「ハイブリッド検索」って出てきたら「キーワード検索とベクトル検索の合わせ技」と思えればだいたいOK!
📖 おまけ:英語の意味
「Hybrid Search」 = 混合検索
💬 「hybrid(混合・掛け合わせ)」で、異なる検索方式を組み合わせるという意味だよ
← 用語集にもどる