ほとんどの人のAI Agentの「計画」への理解は曖昧な概念にとどまります:AgentはN複雑なタスクを「自律的に計画」できる。しかしこの説明は実際の問題を隠しています:LLMの計画方法は何か・どの状況で有効か・どの状況で失敗するか。
LLMの計画メカニズムを理解することはオンチェーンAgentの設計において特に重要です——DeFi戦略Agentの計画失敗は「タスクが完了しなかった」だけでなく、誤ったオンチェーン操作を実行した可能性があります。この記事は4つのAgent計画戦略・各戦略の適用シナリオと失敗パターン・システム設計レベルでどのように計画をより信頼できるにするかを体系的に分析します。
AI Agentにおける計画(Planning)の定義:目標(Goal)と現在の状態(Current State)が与えられたとき、Agentが「目標に到達するアクションシーケンス」を生成するプロセス。オンチェーンAgentの具体的なシナリオでは、計画の問題は:ユーザーが「現在の最良のUSDC収益戦略を見つけて実行して」と言ったとき、Agentは「各プロトコルのAPYを照会 → 利率差を比較 → リバランスが価値があるか判断 → Gas費回収期間を計算 → 実行するか待つかを決定」のアクションシーケンスを計画する必要があります。
計画問題の難しさ:計画生成時、Agentは各ステップの実行結果を知りません;また環境は動的です(APYが実行中に変わる可能性がある)。計画の複雑さによって必要な計画戦略が決まります。
戦略1:反応型計画(ReAct):最も基本的なAgent計画アプローチ——事前に完全な計画を生成せず、各ステップでLLMが現在の状態に基づいて次のアクションを決定します。長所:環境変化への適応性が高い。短所:グローバルな視点が欠如し「近視的な決定」に陥りやすい。
戦略2:事前計画(Plan-then-Execute):ツール呼び出しを実行する前に、LLMに完全な計画を生成させ、次に計画の各ステップを順番に実行します。長所:グローバルな視点が優れており、計画レベルで最適化できる。短所:実行中に環境が変化した場合、固定された計画がもはや適用できない可能性がある。
戦略3:階層的計画(Hierarchical Planning):複雑なタスクを「高レベル計画」と「低レベル計画」の2層に分解します。高レベルPlanner(通常より能力の高いLLM)がタスク分解を担当;低レベルExecutor(より安価なLLMまたは決定論的コード)が各サブゴールの具体的なステップの実行を担当します。コアの利点:サブゴール間の並行実行;高レベルPlannerは低レベルの実行詳細を知る必要がなく、Context複雑度を下げる。これはマルチAgentシステムのアーキテクチャの基盤です。
戦略4:Tree-of-Thought計画(探索的計画):LLMに複数の可能な計画ブランチを同時に探索させ、各ブランチの実現可能性を評価し、最適な計画パスを選択して実行させます。短所:計算コストが高い(複数のLLM推論)。高価値の意思決定に適しています。
失敗1:計画ドリフト(Plan Drift):実行サイクルが増えるにつれ、LLMの推論が最初の計画目標から徐々に逸脱します。防御:各推論サイクル前に「現在の計画と完了したステップ」を構造化PromptとしてContextに注入します。
失敗2:計画の硬直性(Plan Rigidity):中間Observationが計画の調整が必要であることを示していても、LLMが厳密に初期計画を実行します。防御:明示的な「再計画トリガー条件」を設計します。
失敗3:サブゴールの競合(Subgoal Conflict):階層的計画で、高レベルPlannerが分解したサブゴール間に暗黙の競合がある。防御:計画後・サブゴール割り当て前に実現可能性検証ステップを追加します。
失敗4:計画ハルシネーション(Planning Hallucination):LLMが存在しないツール能力を引用するか、成立しない前提条件を仮定します。防御:計画生成後、コードレベルで計画内のツール名がホワイトリストにあるかを検証します。
動的再計画はAgentが実行中に新しいObservationに基づいて計画を更新する能力です——動的な環境(DeFiマーケット)でAgentを有効に保つ重要なメカニズムです。動的再計画は3つのレベルで設計する必要があります:トリガー条件・再計画の範囲・再計画のコスト管理。トリガー条件の設計:事前計画時にLLMに「この計画が成立する前提条件リスト」を同時に出力させ、実行中の各Observation後にこれらの前提条件がまだ成立しているかを自動確認します。最大再計画回数を設定して、Agentが無限再計画ループに陥るのを防ぎます。
計画戦略の選択はAgentのタスクタイプと一致させるべきです:固定利回りスキャン戦略を実行するAgentにはReActで十分;クロスプロトコルのマルチステップ最適化が必要なAgentには再計画トリガーを持つPlan-then-Executeがより適切;「高価値・意思決定複雑・LLMコストをかける価値がある」シナリオでのみTree-of-Thoughtまたは階層的計画を検討します。最も見落とされやすい計画設計の詳細:計画の前提条件の記録と検証です。