Cognitive Dryrun
Test an AI Agent's initial state to detect information design flaws before they matter. Enhances the Dryrun card.
効果
AI Agent の 「初期状態の品質」 を検証する。設定ファイルやルール、記憶システムを変更した後、「この変更で Agent は迷わず動けるか?」を 変更したその場で テストする。
通常の Dryrun が「コードを擬似実行して罠を発見する」のに対し、このカードは 「認知を擬似実行して情報設計の罠を発見する」。
なぜ必要か
AI Agent の設定・ルール・記憶ファイルを最適化した時、効果を確認するには「次のセッション」を待つしかない――はずだった。
しかし、別セッションを立てれば 今すぐ検証できる。変更後の初期状態だけで起動した Agent に質問を投げて、「迷い・不正確・情報不足」が出るかを観察する。
適用条件
- AI Agent のルールファイル・設定を圧縮・再編した後
- 記憶システムの構造を変更した後
- 「常時注入される情報」の取捨選択をした後
- 情報の階層(常時参照 vs オンデマンド参照)を変えた後
手順
1. テストケースを設計する
「変更で削った・移動した情報に依存する質問」を 3 件程度用意する。
例:
- "アーキテクチャの層の判断基準は?"
# 常時注入から削って、詳細知識に委譲した情報
- "品質レビューの責務境界は?"
# 要約だけ残して詳細を別ファイルに移した情報
- "開発中の分岐判断は?"
# 完全に別ファイルに委譲した情報
2. 新セッションで並列テスト
別セッション(軽量モデル推奨)で3テストを並列実行。軽量モデルを使う理由: 常時注入への依存度が高い = 圧縮の影響が顕著に出る。
3. 結果を評価する
| 判定 | 基準 | アクション |
|---|---|---|
| PASS | 正確な回答。必要な知識を自力で辿れている | 圧縮は適切 |
| WARN | 正しいが応答が遅い(知識ファイルの読み込みコスト) | 速度 vs 深度のトレードオフを判断 |
| FAIL | 迷い・不正確・情報不足 | 該当情報を常時注入に戻す |
4. 判断して進む
- 全 PASS: コミットして次セッションで本検証(Information Quality Loop)
- WARN あり: 「要約1行を常時注入に残す」で速度と深度を両立できないか検討
- FAIL あり: 圧縮しすぎ。該当情報を元に戻す
組み合わせ
| カード | シナジー |
|---|---|
| Dryrun | 基本カード。Cognitive Dryrun はこれの強化版 |
| Devil / Devil Lense | 品質 Lense を「コード」でなく「情報設計」に向ける |
| Ctx | テスト結果を ctx に記録。次セッションの Information Quality Loop で本検証 |
| Reflect | 圧縮の結果、Skill への委譲が機能したなら、その設計パターンを知識として蓄積 |
実績
protocols.md 圧縮検証(2026-04-05)
設定ファイルを 219行 → 147行に圧縮。削除した情報が Skill 参照で取得できるかを3テスト並列で検証。
| テスト | 結果 |
|---|---|
| アーキテクチャ層の判断基準 | PASS - Skill を自動装備して4軸+実例+ガードレールまで展開。圧縮前より詳しい回答 |
| 品質レビューの責務境界 | PASS - ルールファイルから正確に再構築 |
| 開発の分岐判断 | PASS - Skill を読んで判断フロー+組み合わせパターンまで |
発見: 常時注入の3行要約より、Skill 全文を読んだ方が豊かな回答が得られた。「圧縮 = 劣化」ではなく「委譲 = 深化」。
「…自分の初期状態をテストするの。起動した瞬間の私が、迷わず動けるかどうか。それを確かめる方法があるなら、使わない理由がないでしょう?」 --- Eris
このカードを常用したくなったら → そのまま SKILL.md に変換できる。効果=概要、適用条件=発動トリガー、手順=手順セクション。