RAG

らぐ

RAG

一言でいうと

LLMが回答する直前に外部の知識ベースから関連情報を取ってきて根拠にする手法のこと。

詳しい意味

RAG（Retrieval-Augmented Generation、検索拡張生成）は、LLMが回答する直前に、社内文書・FAQ・最新情報などの外部知識ベースから関連情報を検索（Retrieval）し、それをプロンプトに含めて回答（Generation）させる手法です。LLMの「学習時点までの知識しかない」「社内固有の情報を知らない」「ハルシネーション（もっともらしい嘘）」といった弱点を、検索で実情報を引っ張ってくることで補います。検索基盤としてエンベディング + ベクトルDBが定番。社内チャットボット、ドキュメント検索、カスタマーサポート自動化の主流アーキテクチャです。

何に使うか

社内ドキュメントを学習させずにLLMに参照させたいとき。最新情報を含む回答を必要とするとき。「根拠となるドキュメントを示しながら回答する」サポートチャットを作るとき。

どんな時に出るか

「RAGで構築」「RAGの精度がいまいち」「RAGじゃなくてファインチューニング」といった場面で登場します。

具体例

社内Wikiを RAG で参照させ、最新の社内情報に基づいた回答を生成するBotを構築した。
RAGで根拠ドキュメントのリンクを併記する設計にして、LLMの幻想（hallucination）リスクを下げた。

別名・略称

rag(らぐ)検索拡張生成(けんさくかくちょうせいせい)Retrieval-Augmented Generation(りとりーばるおーぐめんてっどじぇねれーしょん)

間違えやすい語

初心者向けメモ

学生が試験中に「カンニングペーパーを見ながら答える」のと似ています。LLMが頭の中の知識（学習データ）だけで答えるのではなく、関連書類（検索結果）をその場で見せた上で答えてもらう。結果として最新の・正確な・社内固有の情報で答えられます。

この説明に改善点はありますか？

この説明を修正提案する新しい用語を提案する

提案は管理者が確認した後に反映されます

RAG