GLOSSA

ストリーミング

すとりーみんぐ

Streaming

一言でいうと

LLMの出力を全文完成を待たず、生成された端から少しずつ受け取る仕組みのこと。

詳しい意味

ストリーミングは、LLM の出力を全文が完成するのを待たず、生成された端から少しずつ受け取る仕組みです。ChatGPT のチャット画面で「文字が左から順番に出てくる」体験は、APIのストリーミング応答を画面に逐次描画しているもの。ユーザー体感速度を大きく改善でき、長文回答でも待たされている感覚が薄れます。Server-Sent Events(SSE)や独自のチャンク形式で実装されることが多く、Anthropic / OpenAI / Google の主要 API はすべてストリーミングに対応しています。一方、JSON出力や一括処理用途では非ストリーミングの方が実装が単純です。

何に使うか

チャットUIで応答待ちのユーザー体験を改善したいとき。長文回答のレイテンシー体感を抑えたいとき。途中までの結果から次のアクションを判断したいエージェント設計。

どんな時に出るか

「ストリーミングで出して」「SSEでstream」「ストリーミング中に途中キャンセル」といった場面で登場します。

具体例

  • Anthropic API のストリーミング機能を有効にし、応答が逐次表示されるようにした。
  • ユーザーが Stop ボタンを押したら、ストリーミング中でも途中キャンセルする実装にした。

別名・略称

streaming(すとりーみんぐ)stream(すとりーむ)SSE(えすえすいー)

関連語

LLM

初心者向けメモ

テレビの「生中継」のようなものです。録画完成を待ってから配信(非ストリーミング)するより、撮れた端から流す(ストリーミング)方が、ユーザーは途中から見られて待ち時間が減ります。

この説明に改善点はありますか?

この説明を修正提案する新しい用語を提案する

提案は管理者が確認した後に反映されます