【りらんかー】

リランカー とは?

💡 検索結果の「順番」を見直すスペシャリスト
📌 このページのポイント
リランカーによる二段階検索 Stage 1 - 初回検索(高速) 質問 ベクトル検索 検索結果(スコア順) 文書D - 0.89 文書A - 0.85 文書G - 0.82 文書B - 0.78 文書E - 0.71 上位N件を抽出 Stage 2 - リランク(高精度) クロスエンコーダー 質問×文書ペアで再評価 リランク後(関連度順) 1位 文書A - 0.97 2位 文書G - 0.93 3位 文書D - 0.88 4位 文書B - 0.62 上位を LLM へ渡す
リランカーによる二段階検索の流れ
ひよこ ひよこ

リランカーって何で必要なの?最初の検索で十分じゃない?

ペンギン先生 ペンギン先生

最初の検索(ベクトル検索など)は高速だけど、大雑把なんだ。本屋で例えると、最初の検索は「AIの棚」に行くこと、リランカーはその棚の中から本当に欲しい本を見つけ出すことだよ。二段階にすることで速度と精度を両立できるんだ

ひよこ ひよこ

どうして最初の検索より精度が高くなるの?

ペンギン先生 ペンギン先生

最初のベクトル検索は質問と文書を別々にベクトル化して比較するんだけど、リランカーはクロスエンコーダーという仕組みで質問と文書を同時に入力して評価するんだ。両方を一緒に見るから、文脈を踏まえた精密な判定ができるんだよ

ひよこ ひよこ

じゃあ最初からクロスエンコーダーだけ使えばいいんじゃない?

ペンギン先生 ペンギン先生

クロスエンコーダーは質問と文書のペアごとに計算するから、文書が1万件あったら1万回計算が必要になるんだ。だから最初にベクトル検索で上位20〜50件に絞って、リランカーでその中を精密に並べ替える方が現実的なんだよ

ひよこ ひよこ

RAG以外でも使われるの?

ペンギン先生 ペンギン先生

もちろん!検索エンジンECサイトの商品検索、論文検索など、検索が絡むシステムなら幅広く使われているよ。最近はCohere RerankやJINAのリランカーがAPI経由で簡単に使えるから、RAGの精度改善で最初に試す施策としても人気だね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「リランカー」って出てきたら「検索結果の順番を賢く並べ替えるAI」と思えればだいたいOK!
📖 おまけ:英語の意味
「Reranker」 = 再順位付けモデル
💬 Re(再び)+ Rank(順位をつける)+ er(するもの)で、一度並んだ結果をもう一回並べ直す役割だよ
← 用語集にもどる