GLOSSA

RAG

らぐ

RAG

一言でいうと

LLMが回答する直前に外部の知識ベースから関連情報を取ってきて根拠にする手法のこと。

詳しい意味

RAG(Retrieval-Augmented Generation、検索拡張生成)は、LLMが回答する直前に、社内文書・FAQ・最新情報などの外部知識ベースから関連情報を検索(Retrieval)し、それをプロンプトに含めて回答(Generation)させる手法です。LLMの「学習時点までの知識しかない」「社内固有の情報を知らない」「ハルシネーション(もっともらしい嘘)」といった弱点を、検索で実情報を引っ張ってくることで補います。検索基盤としてエンベディング + ベクトルDBが定番。社内チャットボット、ドキュメント検索、カスタマーサポート自動化の主流アーキテクチャです。

何に使うか

社内ドキュメントを学習させずにLLMに参照させたいとき。最新情報を含む回答を必要とするとき。「根拠となるドキュメントを示しながら回答する」サポートチャットを作るとき。

どんな時に出るか

「RAGで構築」「RAGの精度がいまいち」「RAGじゃなくてファインチューニング」といった場面で登場します。

具体例

  • 社内Wikiを RAG で参照させ、最新の社内情報に基づいた回答を生成するBotを構築した。
  • RAGで根拠ドキュメントのリンクを併記する設計にして、LLMの幻想(hallucination)リスクを下げた。

別名・略称

rag(らぐ)検索拡張生成(けんさくかくちょうせいせい)Retrieval-Augmented Generation(りとりーばるおーぐめんてっどじぇねれーしょん)

関連語

エンベディングLLMファインチューニング

間違えやすい語

ファインチューニング

初心者向けメモ

学生が試験中に「カンニングペーパーを見ながら答える」のと似ています。LLMが頭の中の知識(学習データ)だけで答えるのではなく、関連書類(検索結果)をその場で見せた上で答えてもらう。結果として最新の・正確な・社内固有の情報で答えられます。

この説明に改善点はありますか?

この説明を修正提案する新しい用語を提案する

提案は管理者が確認した後に反映されます