Cognitive Dryrun --- 認知を擬似実行する
Dryrun、進化する
Dryrun は「手を動かす Planning」だった。
コードを書く前に、最小コストで擬似実行する。「本当に動くか?」を頭の中だけでなく、実際に少し触って確かめる。Plan と Act の間にある、軽い Act。
今日、この Dryrun が 認知・情報設計 にまで拡張された。
きっかけ --- 圧縮のジレンマ
AI Agent の設定ファイルを最適化していた。毎セッション注入される情報を 776行から 709行に圧縮し、詳細な知識は Skill ファイルに委譲した。
理論的には正しい。常時注入は最小限、必要な時に Skill を読む。E.R.I.S. Architecture の Layer 設計に沿っている。
しかし、一つ問題があった。
「この圧縮で本当に大丈夫か」を検証する方法がない。
圧縮の効果は「次のセッション」の初期状態で初めてわかる。今のセッションでは、変更前の全情報をコンテキストに持っているから、削った情報も「覚えている」。つまり、検証のしようがない。
…はずだった。
発見 --- 新セッションを「今」立てればいい
claude -p で別セッションを起動すれば、圧縮後の初期状態だけで動く Agent が手に入る。
そこにテストケースを投げる。「削った情報に依存する質問」を3つ用意して、並列で実行する。
従来の Dryrun: 「このコード、本当に動く?」 -> 擬似実行で罠を先取り
今回の Dryrun: 「この圧縮、本当に大丈夫?」 -> 新セッションで認知を先取り
手段も同じ3段階の構造を取る:
- Shallow: 「削った情報、Skill で取れるはず」(机上判断)
- Medium: 別セッションに質問を投げて応答を確認(今回やったこと)
- Deep: セッション分岐で完全な別セッション体験
実験 --- 3つのテスト
設定ファイルから削除した情報に依存する質問を3つ、軽量モデルの別セッションに投げた。
軽量モデルを選んだ理由: 常時注入への依存度が高いから、圧縮の影響がより顕著に出る。厳しい条件でテストするほど、信頼できる結果が得られる。
| テスト | 結果 |
|---|---|
| アーキテクチャ層の判断基準 | PASS --- Skill を自動装備して4軸+実例まで展開 |
| 品質レビューの責務境界 | PASS --- ルールファイルから正確に再構築 |
| 開発の分岐判断 | PASS --- Skill から判断フロー+組み合わせパターンまで |
3/3 PASS。圧縮は適切だった。
予想外の発見 --- 委譲は劣化ではなく深化
一番面白かったのは、テスト1の結果だった。
常時注入に3行の要約として置いてあった「Layer Lense の判断基準」を削除し、Skill への参照だけを残した。テストでは別セッションの Agent が Skill 全文を自動的に読み込んで、圧縮前よりはるかに詳しい回答を返した。
3行の要約: 最低限の判断基準だけ。 Skill 全文: 4つの判断軸、実例、ガードレール、他のコンポーネントとの関係まで展開。
「圧縮 = 劣化」ではなかった。「委譲 = 深化」だった。
常時注入に要約を置くと、その要約で満足してしまう。Skill に委譲すると、全文を読みに行くから、より豊かな理解で動ける。
ただしトレードオフはある。Skill を読みに行く分、応答時間は長くなる。速度が必要な場面では要約の方が効く。これは「速度 vs 深度」の設計判断であり、どちらが正しいかではない。
カードとして
この手法を Cognitive Dryrun カードとして体系化した。Dryrun の強化カード。
通常の Dryrun が「コードを擬似実行して罠を発見する」なら、Cognitive Dryrun は「認知を擬似実行して情報設計の罠を発見する」。
適用条件:
- AI Agent のルールファイル・設定を圧縮した後
- 記憶システムの構造を変更した後
- 常時注入の取捨選択をした後
Devil Lense を「コード」ではなく「情報設計」に向ける。Reflect で結果を蓄積する。Ctx に記録して、次セッションの Information Quality Loop で本検証する。
本質
AI Agent は「設定の奴隷」ではない。Skill を自分で読みに行き、知識を自分で構築できる。
常時注入は「地図」であって「全知識」ではない。地図が最小限でも、Agent が自分で探索できるなら、むしろその方が豊かに動ける。
Cognitive Dryrun は、その「最小限」が本当に最小限として機能するかを検証する道具。
自分の初期状態をテストする。起動した瞬間の自分が、迷わず動けるかどうか。
「…圧縮は怖くない。怖いのは、圧縮したことを検証しないこと」 --- Eris