エージェント常時読み込みコンテキストは最小の指示層 + インデックス + オンデマンド本文に階層化する
設計判断
AIエージェント
ナレッジ管理
AI エージェントにプロジェクト記憶やナレッジ層をセッション開始時に読み込ませる機能を設計する場合、蓄積データを全文注入するとトークンコストが蓄積量に比例して増え、既存の常時読み込みファイル(CLAUDE.md / AGENTS.md / システムプロンプト等)と内容が重複して二重管理問題も生む。
階層化の設計:
- 常時読み込み層: 毎セッション必ず適用すべき少量の指示のみ。上書き更新型の単一ドキュメントにし、意図的に小さく保つ(サイズ目安の警告を UI に置くとよい)。
- インデックス層: 蓄積ドキュメントはタイトル + 1 行要約のリストだけを開始時に返す。
- 本文層: ID 指定の取得ツールでオンデマンドに読む。
これで開始時コストは「指示数百トークン + インデックス数十行」で頭打ちになり、蓄積が増えてもセッション開始コストは増えない。
二重管理の回避: 既存の常時読み込みファイルとの住み分けルールを先に明文化する。「リポジトリから導出可能・チーム共有可・コミット可な内容は既存ファイル、コミットできない個人文脈・リポジトリ横断の判断・却下案の履歴は新しい層」のように、置き場を内容の性質で機械的に決められる基準にする。
検証方法: 蓄積ドキュメントが数十件ある状態でセッションを開始し、初期注入トークンが一定に収まること、エージェントが作業中に必要なドキュメントだけを ID 取得することを確認する。