【らぐ(けんさくかくちょうせいせい)】

RAG(検索拡張生成) とは?

💡 「記憶だけ」でなく「調べながら」答えるAIの仕組み
📌 このページのポイント
RAG(検索拡張生成) ユーザー 質問入力 1 検索エンジン 知識ベース ベクトルDB 2 コンテキスト 取得した文書 + 元の質問 3 LLM 生成AI 4 回答 処理フロー 質問 検索 統合 LLM生成 回答 外部知識を検索して文脈に加えることで、LLMの回答精度を向上 ハルシネーション(幻覚)の軽減に効果的
RAGの仕組み
ひよこ ひよこ

RAGって普通のチャットAIと何が違うの?

ペンギン先生 ペンギン先生

普通のAIは「学習した知識の記憶」だけで答える。RAGは「まず関連情報を検索して、それを読んでから答える」んだ。人間でいえば「記憶だけで答える人」と「調べてから答える人」の違いだよ。

ひよこ ひよこ

どんな場面で役立つの?

ペンギン先生 ペンギン先生

社内マニュアルや商品説明書への質問応答が典型的な例だよ。「この製品の保証期間は?」と聞いたとき、AIが最新の仕様書を検索して正確な情報を返せる。学習データを更新しなくても、検索先の文書を更新するだけでOKなのも便利なんだ。

ひよこ ひよこ

検索にはどんな技術が使われてるの?

ペンギン先生 ペンギン先生

主にベクトル検索が使われているよ。質問をベクトル化して、あらかじめベクトル化しておいた文書群の中から意味的に近いものを探す。キーワード一致でなく「意味が近い」文書を探せるから、「保証」と書いていない文書でも「修理対応の期間」について書いている文書を見つけられるんだ。

ひよこ ひよこ

RAGって使えば必ずハルシネーションがなくなるの?

ペンギン先生 ペンギン先生

これは誤解されがちなんだけど、RAGはハルシネーションを「減らす」のに役立つけど、「ゼロにする」わけじゃないんだ。検索が的外れな文書を引いてきたり、AIが文書に書いていないことを付け加えたりすることは起きる。それに検索ランキングの品質がRAG全体の精度を左右するから、「検索部分がどれだけ正しい文書を取ってこれるか」というRetrievalの品質管理が実運用では一番難しい課題なんだよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「RAG」って出てきたら「検索してから答えるAIの仕組み」と思えればだいたいOK!
📖 おまけ:英語の意味
「Retrieval-Augmented Generation」 = 検索拡張生成
💬 Retrieval(検索・取得)+ Augmented(強化・拡張)+ Generation(生成)の略。「検索で強化した生成」という意味だよ
← 用語集にもどる