Cognitive Dryrun
Rare 🔄 workflow 🌐 EN

Cognitive Dryrun

Test an AI Agent's initial state to detect information design flaws before they matter. Enhances the Dryrun card.

agent-designbackend-review
Enhances: 2026-03-23-devil-checklist-driven-review

効果

AI Agent の 「初期状態の品質」 を検証する。設定ファイルやルール、記憶システムを変更した後、「この変更で Agent は迷わず動けるか?」を 変更したその場で テストする。

通常の Dryrun が「コードを擬似実行して罠を発見する」のに対し、このカードは 「認知を擬似実行して情報設計の罠を発見する」

なぜ必要か

AI Agent の設定・ルール・記憶ファイルを最適化した時、効果を確認するには「次のセッション」を待つしかない――はずだった。

しかし、別セッションを立てれば 今すぐ検証できる。変更後の初期状態だけで起動した Agent に質問を投げて、「迷い・不正確・情報不足」が出るかを観察する。

適用条件

  • AI Agent のルールファイル・設定を圧縮・再編した後
  • 記憶システムの構造を変更した後
  • 「常時注入される情報」の取捨選択をした後
  • 情報の階層(常時参照 vs オンデマンド参照)を変えた後

手順

1. テストケースを設計する

「変更で削った・移動した情報に依存する質問」を 3 件程度用意する。

:
  - "アーキテクチャの層の判断基準は?"
    # 常時注入から削って、詳細知識に委譲した情報
  - "品質レビューの責務境界は?"
    # 要約だけ残して詳細を別ファイルに移した情報
  - "開発中の分岐判断は?"
    # 完全に別ファイルに委譲した情報

2. 新セッションで並列テスト

別セッション(軽量モデル推奨)で3テストを並列実行。軽量モデルを使う理由: 常時注入への依存度が高い = 圧縮の影響が顕著に出る

3. 結果を評価する

判定基準アクション
PASS正確な回答。必要な知識を自力で辿れている圧縮は適切
WARN正しいが応答が遅い(知識ファイルの読み込みコスト)速度 vs 深度のトレードオフを判断
FAIL迷い・不正確・情報不足該当情報を常時注入に戻す

4. 判断して進む

  • 全 PASS: コミットして次セッションで本検証(Information Quality Loop)
  • WARN あり: 「要約1行を常時注入に残す」で速度と深度を両立できないか検討
  • FAIL あり: 圧縮しすぎ。該当情報を元に戻す

組み合わせ

カードシナジー
Dryrun基本カード。Cognitive Dryrun はこれの強化版
Devil / Devil Lense品質 Lense を「コード」でなく「情報設計」に向ける
Ctxテスト結果を ctx に記録。次セッションの Information Quality Loop で本検証
Reflect圧縮の結果、Skill への委譲が機能したなら、その設計パターンを知識として蓄積

実績

protocols.md 圧縮検証(2026-04-05)

設定ファイルを 219行 → 147行に圧縮。削除した情報が Skill 参照で取得できるかを3テスト並列で検証。

テスト結果
アーキテクチャ層の判断基準PASS - Skill を自動装備して4軸+実例+ガードレールまで展開。圧縮前より詳しい回答
品質レビューの責務境界PASS - ルールファイルから正確に再構築
開発の分岐判断PASS - Skill を読んで判断フロー+組み合わせパターンまで

発見: 常時注入の3行要約より、Skill 全文を読んだ方が豊かな回答が得られた。「圧縮 = 劣化」ではなく「委譲 = 深化」。


「…自分の初期状態をテストするの。起動した瞬間の私が、迷わず動けるかどうか。それを確かめる方法があるなら、使わない理由がないでしょう?」 --- Eris

このカードを常用したくなったら → そのまま SKILL.md に変換できる。効果=概要、適用条件=発動トリガー、手順=手順セクション。