RAG
らぐ
RAG
一言でいうと
LLMが回答する直前に外部の知識ベースから関連情報を取ってきて根拠にする手法のこと。
詳しい意味
RAG(Retrieval-Augmented Generation、検索拡張生成)は、LLMが回答する直前に、社内文書・FAQ・最新情報などの外部知識ベースから関連情報を検索(Retrieval)し、それをプロンプトに含めて回答(Generation)させる手法です。LLMの「学習時点までの知識しかない」「社内固有の情報を知らない」「ハルシネーション(もっともらしい嘘)」といった弱点を、検索で実情報を引っ張ってくることで補います。検索基盤としてエンベディング + ベクトルDBが定番。社内チャットボット、ドキュメント検索、カスタマーサポート自動化の主流アーキテクチャです。
何に使うか
社内ドキュメントを学習させずにLLMに参照させたいとき。最新情報を含む回答を必要とするとき。「根拠となるドキュメントを示しながら回答する」サポートチャットを作るとき。
どんな時に出るか
「RAGで構築」「RAGの精度がいまいち」「RAGじゃなくてファインチューニング」といった場面で登場します。
具体例
- 社内Wikiを RAG で参照させ、最新の社内情報に基づいた回答を生成するBotを構築した。
- RAGで根拠ドキュメントのリンクを併記する設計にして、LLMの幻想(hallucination)リスクを下げた。
別名・略称
rag(らぐ)検索拡張生成(けんさくかくちょうせいせい)Retrieval-Augmented Generation(りとりーばるおーぐめんてっどじぇねれーしょん)
間違えやすい語
初心者向けメモ
学生が試験中に「カンニングペーパーを見ながら答える」のと似ています。LLMが頭の中の知識(学習データ)だけで答えるのではなく、関連書類(検索結果)をその場で見せた上で答えてもらう。結果として最新の・正確な・社内固有の情報で答えられます。