Question 1

Sandbox (Agent Execution Sandbox) 為什麼重要？

Accepted Answer

**沙盒有哪四個隔離維度？每個維度具體限制什麼？**

完整的 Agent 沙盒從四個維度隔離 Agent 的行為：

**維度一：工具調用限制（Tool Call Restriction）**
Agent 只能調用明確白名單的工具函數，不能調用任何沙盒外的代碼。實作：在 LangChain 或 Claude 的 Tool Use 機制裡，只傳入 Agent 業務需要的工具清單，不傳入「調試工具」、「系統管理工具」等額外工具。一個 DeFi 利率優化 Agent 只需要「查詢 APY」和「執行移倉」兩個工具，不需要（也不應該有）「讀取服務器文件」或「發送任意 HTTP 請求」的工具。

**維度二：網路訪問限制（Network Access Control）**
Agent 執行環境的網路出站請求只允許到白名單域名（Aave API、Compound API、以太坊 RPC 節點）。禁止向任意外部 URL 發請求——防止 Prompt Injection 讓 Agent 把內部數據（交易記錄、私鑰片段）發送到攻擊者控制的服務器。實作：在 Docker 容器或 Cloud Run 的網路配置裡設置出站域名白名單。

**維度三：文件系統限制（File System Isolation）**
Agent 執行環境只能讀取工作所需的特定目錄（如配置文件），禁止讀取包含私鑰、數據庫密碼等敏感信息的系統目錄。實作：以非 root 用戶運行 Agent 進程，掛載只讀文件系統（除了 Agent 日誌目錄）。

**維度四：資源使用限制（Resource Quotas）**
限制 Agent 進程的 CPU、內存、并發線程數、每分鐘 LLM API 調用次數。防止「資源耗盡攻擊」——攻擊者通過 Prompt Injection 讓 Agent 進入無限循環推理，消耗所有計算資源直到服務崩潰。

Question 2

Sandbox (Agent Execution Sandbox) 如何運作？

Accepted Answer

**沙盒逃逸攻擊（Sandbox Escape）是什麼？在 Agent 場景下有哪些已知的逃逸向量？**

沙盒逃逸是指攻擊者利用沙盒實作的漏洞，讓 Agent 執行了沙盒邊界之外的操作。在 Agent 場景下，沙盒逃逸的危險特性是：攻擊者不需要直接接觸底層系統，而是通過操控 Agent 的 LLM 推理，讓 LLM 自己「找到」沙盒的漏洞。主要的逃逸向量：

**向量一：工具描述注入（Tool Description Injection）**
攻擊者通過 Prompt Injection 讓 LLM「誤解」一個工具的功能——例如，讓 LLM 相信「get_market_data」工具實際上可以用來「發送任意 HTTP 請求」（通過修改 Agent Context 裡的工具描述）。如果工具的安全邊界只靠描述文字維護（而不是後端代碼），這個向量就是可行的。防禦：工具的安全邊界必須在後端代碼裡實現，不能只靠 Tool Description 的文字說明。

**向量二：間接工具鏈攻擊（Indirect Tool Chaining）**
攻擊者讓 Agent 組合調用多個允許的工具，達到任何單個工具都不被允許的效果。例如：`read_config_file` 和 `append_to_log` 都是允許的工具，但攻擊者讓 Agent 先讀取敏感配置文件，再把內容 append 到日誌文件（日誌文件可以被攻擊者外部訪問）。防禦：工具間的組合操作需要後端的語義驗證，不只是單個工具的參數驗證。

**向量三：長上下文記憶污染（Long-Context Memory Poisoning）**
攻擊者通過長時間的小步驟 Prompt Injection，逐漸在 Agent 的 Context 裡建立一套「假認知體系」（例如：逐漸讓 Agent 相信某個惡意地址是「已授權的白名單地址」），直到 Context 裡的假認知積累足夠，Agent 主動繞過白名單執行惡意操作。防禦：定期清除和重建 Agent Context，從後端白名單（代碼）重新載入，不信任 Context 裡的「白名單描述」。

Question 3

Sandbox (Agent Execution Sandbox) 如何實際應用？

Accepted Answer

**在 Onchain Agent 裡，沙盒和白名單怎麼分工？兩者不能互相替代的原因是什麼？**

這是 Agent 安全設計裡最容易混淆的概念。沙盒和白名單是互補的兩層保護，各自防禦不同的攻擊面：

**白名單（Whitelist）回答的問題**：「這個 Agent 被允許和哪些地址、哪些協議、哪些代幣互動？」
- 地址白名單：Agent 只能向 Aave、Morpho、Compound 的合約地址發送交易，不能向任意地址轉帳
- 協議白名單：Agent 只能調用白名單協議的特定函數（不能調用協議合約的任意函數）
- 代幣白名單：Agent 只能操作 USDC、USDT，不能操作任意 ERC-20 代幣

白名單是「業務邏輯層的限制」，定義了 Agent 被允許做什麼業務操作。

**沙盒（Sandbox）回答的問題**：「Agent 的執行環境被允許做哪些系統操作？」
- 網路白名單：Agent 執行環境只能訪問白名單域名的 API（不能向任意 URL 發請求）
- 工具白名單：Agent 只能調用指定的工具函數集（不能調用任意代碼）
- 資源限制：Agent 的 CPU/內存/網路帶寬有上限（防資源耗盡攻擊）

沙盒是「系統層的限制」，定義了 Agent 被允許在什麼環境裡操作。

**為什麼不能互相替代**：攻擊者可以在不違反業務白名單的情況下，利用系統層的漏洞（例如讓 Agent 通過合法的「查詢工具」讀取敏感配置文件，再用合法的「日誌寫入工具」把信息洩漏出去）。沙盒在系統層阻止這類攻擊，白名單無法阻止它。兩者缺一，防禦就有盲區。