Question 1

Sandbox (Agent Execution Sandbox)とは何ですか？

Accepted Answer

**サンドボックスの4つの隔離次元は何ですか？各次元は具体的に何を制限しますか？**

完全なAgentサンドボックスは4つの次元でAgentの行動を隔離します：

**次元1：ツール呼び出し制限（Tool Call Restriction）**
Agentは明確にホワイトリストに登録されたツール関数のみを呼び出せます。実装：LangChainまたはClaudeのTool Useメカニズムでは、Agentのビジネスに必要なツールのみを渡します——「デバッグツール」や「システム管理ツール」は含めません。DeFi利回り最適化AgentはAPYクエリと移行実行の2つのツールのみが必要で、「サーバーファイルの読み取り」や「任意のHTTPリクエスト送信」は不要です。

**次元2：ネットワークアクセス制御（Network Access Control）**
Agent実行環境からのネットワーク送信はホワイトリストドメイン（Aave API・Compound API・Ethereum RPCノード）のみに許可されます。任意の外部URLへのリクエストはブロックされます——Prompt InjectionによってAgentが内部データを攻撃者のサーバーに送信するのを防ぎます。

**次元3：ファイルシステム隔離（File System Isolation）**
Agent実行環境は作業に必要な特定のディレクトリのみ読み取り可能で、秘密鍵・データベースパスワードなどの機密情報を含むシステムディレクトリの読み取りはブロックされます。

**次元4：リソースクォータ（Resource Quotas）**
AgentプロセスのCPU・メモリ・並行スレッド数・1分あたりのLLM API呼び出し回数を制限します。「リソース枯渇攻撃」を防ぎます——Prompt InjectionがAgentを無限ループ推論に入らせ、サービスがクラッシュするまですべての計算リソースを消費する攻撃です。

Question 2

Sandbox (Agent Execution Sandbox)の仕組みは？

Accepted Answer

**サンドボックスエスケープ攻撃とは何ですか？Agentのコンテキストではどのような既知のエスケープベクターがありますか？**

サンドボックスエスケープとは、攻撃者がサンドボックス実装の脆弱性を悪用して、AgentにサンドボックスBoundary外の操作を実行させることです。Agentコンテキストでの危険な特性は、攻撃者が基盤システムに直接アクセスする必要がなく、AgentのLLM推論を操作してLLM自身にサンドボックスの脆弱性を「発見」させることです。主な攻撃ベクター：

**ベクター1：ツール説明インジェクション（Tool Description Injection）**
Prompt Injectionを通じて、攻撃者はLLMにツールの機能を「誤解」させます——例えば「get_market_data」ツールが実際には「任意のHTTPリクエストを送信」するために使用できると信じさせます（AgentのContextのツール説明を変更することで）。ツールのセキュリティ境界が説明文のみで維持されている場合（バックエンドコードではなく）、このベクターは実行可能です。防御：ツールのセキュリティ境界はバックエンドコードで実装される必要があります。

**ベクター2：間接ツールチェーン攻撃（Indirect Tool Chaining）**
攻撃者はAgentに複数の許可されたツールを組み合わせて呼び出させ、どの単一ツールでも許可されない効果を達成させます。`read_config_file`と`append_to_log`はどちらも許可されたツールですが、攻撃者はAgentに最初に機密設定ファイルを読み取らせ、次にそのコンテンツをログファイルに追記させます（ログファイルには攻撃者が外部からアクセス可能）。

**ベクター3：長コンテキストメモリ汚染（Long-Context Memory Poisoning）**
持続的な小さなステップのPrompt Injectionを通じて、攻撃者はAgentのContextに徐々に「偽の信念システム」を構築します。防御：定期的にAgentのContextをクリアして再構築し、バックエンドのホワイトリスト（コード）から再ロードします。

Question 3

Sandbox (Agent Execution Sandbox)の実際の活用法は？

Accepted Answer

**オンチェーンAgentにおいて、サンドボックスとホワイトリストはどのように役割分担しますか？互いに代替できない理由は何ですか？**

これはAgentセキュリティ設計で最も混乱しやすい概念です。サンドボックスとホワイトリストは補完的な2つの保護層であり、それぞれ異なる攻撃面を防御します：

**ホワイトリストが答える質問**：「このAgentはどのアドレス・プロトコル・トークンとのインタラクションが許可されていますか？」
- アドレスホワイトリスト：AgentはAave・Morpho・Compoundのコントラクトアドレスにのみトランザクションを送信できます
- プロトコルホワイトリスト：Agentはホワイトリストプロトコルの特定の関数のみを呼び出せます
- トークンホワイトリスト：AgentはUSDC・USDTのみを操作できます

ホワイトリストは「ビジネスロジック層の制限」であり、Agentが実行を許可されているビジネス操作を定義します。

**サンドボックスが答える質問**：「AgentのExecution Environmentではどのシステム操作が許可されていますか？」
- ネットワークホワイトリスト：Agent実行環境はホワイトリストドメインAPIのみアクセス可能
- ツールホワイトリスト：Agentは指定されたツール関数セットのみを呼び出せます
- リソース制限：AgentのCPU・メモリ・帯域幅に上限があります

**互いに代替できない理由**：攻撃者はビジネスホワイトリストに違反することなくシステム層の脆弱性を悪用できます。サンドボックスはこの種の攻撃をシステム層で防ぎますが、ホワイトリストは防げません。どちらが欠けても防御に盲点が生じます。