AI活用の方は必見！AIの作業メモリであるコンテキストウィンドウとは？

chatGPT活用

みなさん、こんにちわ！研究所です。

現代の生成AI（LLM）は、人間と自然な会話を成立させたり、大量の文章データを理解・要約したりといった高度なコミュニケーション能力を備えています。しかし、このような能力を実現するには、AIが「今どの文脈を参照すれば正しい応答ができるか」を継続的に判断する必要があります。

具体的には：

会話の途中で前に言ったことを覚えていない……
　例えば、質問のやり取りが長引くと、AIが先ほどの発言や前後関係を忘れてしまい、不自然な応答になることがあります。
長いドキュメントを一気に要約するのは難しい……
　書籍や契約書など膨大な情報を一度に読み込ませて分析させたい場合、AIにはどこまで「前後の情報」を覚えておけるのかが重要になります。

このような「どこまで記憶し続けられるか」の限界を把握し、それを超えないように入力や対話を扱うための基準として必要なのが、コンテキストウィンドウという概念です

Table of Contents

コンテキストウィンドウとは？

「コンテキストウィンドウ」とは、「モデルが一度に処理・参照できるテキスト情報(トークン数)の上限」を意味します。特に、入力プロンプト＋生成出力を合わせたトークン数の制限として定義されます。

トークンは「単語」「語の一部」「句読点」などの単位で、英語では1.5単語程度、日本語では1文字＝約1〜2トークン程度でカウントされます。
つまり、モデルにとっての「作業机」の広さに例えられ、情報量が多いほど長文でも一貫性を保って処理できるわけです。一般には「モデルのワーキングメモリ」として説明されます。

このようなモデルが一度に処理できるトークン量を指す「コンテキストウィンドウ」ですが、

主要な生成モデルのコンテキストウィンドウサイズを見ていきましょう。

長文の書類や論文をそのまま読み込んで要約・質問応答する用途に最適。
複数のドキュメントを統合・比較した詳細分析や複雑なプロジェクトのレビューにも利用できる。
RAG（Retrieval-Augmented Generation）との組み合わせで大量データを参照しながら、文脈の全体を把握する運用も可能に Zenn。

ただし、ChatGPTのUIではアップロードドキュメントが直接処理可能に見えても、実は内部ではRAGによるチャンク分割＋類似検索方式で処理されており、実際のコンテキストウィンドウにすべての情報が入っている訳ではない場合もあります。

最新情報をチェックしよう！