beginners

怎麼看懂 AI Agent 的日誌：五種必看日誌類型、一筆交易的完整追蹤路徑，以及 Prompt Injection 的日誌特徵

30 秒速讀

Agent 日誌多了一個維度：LLM 推理了什麼。沒有 Thought Log 的 Agent，出問題時你永遠只知道「它做了什麼」，但不知道「為什麼」——而「為什麼」才是真正找到問題的關鍵。

Grace Patel · 2026/06/27

完整解析 +

01 · 為什麼發生？

用什麼工具來管理和查詢 Agent 日誌最有效？

LangSmith：LangChain/LangGraph 的官方追蹤平台，自動記錄 LLM 每次調用（完整 Thought 輸出）、工具調用（輸入/輸出）、整個 Chain 的執行時間和 Token 消耗。可視化執行樹，免費版支持基礎追蹤，付費 $39/月起。

Langfuse：開源替代方案，可自架，適合對數據隱私要求高的場景（財務數據的 Agent）。

自建（structlog + PostgreSQL）：對不用 LangChain 的 Agent，最直接的方案。用 Python 的 structlog 庫輸出結構化 JSON 日誌，存入 PostgreSQL，可以用 SQL 查詢（「找出過去 24 小時所有 BLOCKED 的 Validation 記錄」）。成本：幾乎只有服務器費用。

02 · 運作原理是什麼？

Agent 日誌應該保留多久？

按重要性分類的保留建議：LLM Thought Log：90 天（大部分安全事件在 30 天內被發現）；工具調用日誌：90 天；後端驗證日誌：180 天（安全審計需要更長歷史窗口）；鏈上執行日誌：永久保留核心字段（tx_hash、金額、時間）；熔斷告警日誌：180 天。90 天後，把 Thought Log 壓縮成決策摘要存入冷存儲（S3 Glacier，熱存儲成本的 10%）。

03 · 如何應用

Agent 日誌裡的隱私問題怎麼處理？

Agent 的日誌可能包含高度敏感信息：DeFi 策略邏輯、操作錢包地址、市場持倉信息。基本防護：日誌不以明文存放在公共存儲（PostgreSQL 開啟 TDE 加密，文件系統用 AES-256）；訪問控制只限你和必要的運維人員；敏感字段脫敏（記錄「withdraw: 5000 USDC from protocol A」而不是「wallet 0x1234... withdraw 5000」）。使用第三方日誌服務（LangSmith）前確認其隱私政策——LangSmith 聲明不使用 traces 訓練模型。

04 · 我該怎麼做？

新手部署第一個 Agent 時，日誌系統怎麼最小化設計？

最小可行日誌方案（兩天內完成）：第一步：確保 Thought Log 有記錄——每次 LLM 輸出後寫入文件（Python logging.info()），或用 LangSmith。第二步：確保鏈上執行日誌有記錄——每次廣播後記錄 tx_hash 和預期操作。第三步（第一個月內加）：加入後端驗證日誌——每次驗證記錄「條件 + 結果 + APPROVED/BLOCKED」。工具：Python logging 模塊 + Railway Log Viewer，等系統穩定後再升級到 LangSmith 或自建 PostgreSQL。

完整內容 +

你的 AI Agent 在凌晨 3 點執行了一筆你完全沒預期的操作。你打開系統看到一串日誌，但不知道從哪裡開始讀、讀什麼、怎麼找到「到底發生了什麼」。這是大多數 Agent 初學者的第一個真實挫折。

Agent 的日誌和普通應用的日誌根本性地不同——普通應用的日誌是「執行了什麼代碼、出現了什麼錯誤」，Agent 的日誌多了一個維度：「LLM 推理了什麼」。如果你只看執行層的日誌，忽略了 LLM 的推理過程，你永遠不知道 Agent 為什麼做了那個決定。這篇文章從實際操作出發，告訴你 Agent 日誌應該記錄什麼、怎麼讀懂每種日誌、以及怎麼用日誌追蹤一筆交易的完整執行路徑。

為什麼 Agent 日誌和普通應用日誌不同

普通應用的執行邏輯是確定性的：輸入 A → 代碼執行路徑 B → 輸出 C。只要代碼不變，同樣的輸入永遠得到同樣的輸出。日誌的作用是記錄「代碼執行路徑上發生了什麼」，出問題時找 Error 和 Exception。

Agent 的執行邏輯是非確定性的：輸入 A → LLM 推理（不確定）→ 工具調用決策（不確定）→ 外部工具執行（不確定）→ 觀察結果（不確定）→ 再次 LLM 推理...。同樣的輸入在不同的市場環境、不同的 Context 歷史下可能得到完全不同的 Agent 行為。Agent 出問題時，你不只需要知道「代碼執行路徑」，更需要知道「LLM 推理了什麼、基於什麼信息、做了什麼決策」——因為問題可能不在代碼，而在 LLM 的推理本身。

這意味著完整的 Agent 日誌系統必須包含四個層次：LLM 推理日誌、工具調用日誌、後端驗證日誌、和鏈上執行日誌。缺少任何一層，你的 debug 能力就有盲區。

五種必看的日誌類型

類型一：LLM 推理日誌（Thought Log）

這是 Agent 日誌裡最重要、也最容易被忽略的日誌。它記錄的是 Agent 在 ReAct 框架裡每個 Thought 步驟的完整輸出——也就是「Agent 在決定調用工具之前，它的推理過程是什麼」。一條典型的 Thought Log 看起來像：

[2026-06-27 03:12:44 UTC] THOUGHT: Current market data shows Aave APY=4.2%, Morpho APY=5.1%. The 0.9% difference exceeds the 0.5% rebalancing threshold. Decision: execute rebalance from Aave to Morpho.

Thought Log 能讓你看到 Agent 決策背後的「為什麼」。如果 Agent 執行了你沒預期的操作，第一步永遠是看 Thought Log：Agent 是基於什麼數據做了這個決定？它引用的數字是不是真實的工具回傳數據，還是它「想象」的數字（幻覺）？

類型二：工具調用日誌（Tool Call Log）

記錄每次工具函數調用的完整信息：調用了什麼工具、傳入了什麼參數、工具回傳了什麼原始數據、調用耗時多少、是否成功。典型格式：

[2026-06-27 03:12:45 UTC] TOOL_CALL: get_aave_apy | params: {token: USDC} | result: {apy: 4.2, tvl: 3200000000} | latency: 340ms | status: success

工具調用日誌是你驗證「Thought Log 裡的數字有沒有真實的工具回傳支撐」的依據。如果 Thought Log 說「Morpho APY 是 5.1%」，但工具調用日誌裡 get_morpho_apy 的回傳是 apy: 3.8，說明 LLM 在推理時忽略了工具的實際回傳，用了一個幻覺數字。

類型三：後端驗證日誌（Validation Log）

記錄每次 Agent 嘗試調用寫入工具（執行鏈上操作）時，後端驗證層的決策過程。包含：被提交的操作、每個驗證條件的檢查結果、是否通過（執行）或被攔截（拒絕）。典型格式：

[2026-06-27 03:12:52 UTC] VALIDATION: withdraw_from_aave | amount=5000 | check_amount_limit: PASS | check_whitelist: PASS | APPROVED

後端驗證日誌讓你知道「哪些操作被 Agent 嘗試過但被安全系統攔截了」。如果你看到大量「BLOCKED: address not in whitelist」的記錄，可能意味著 Agent 正在嘗試和白名單外的地址互動，可能是 Prompt Injection 攻擊。

類型四：熔斷告警日誌（Circuit Breaker Log）

記錄所有觸發熔斷條件的事件：哪個熔斷條件被觸發、觸發時的市場數據或 Agent 狀態、熔斷後 Agent 採取的自動動作（暫停操作、發送告警）。這個日誌讓你在事後評估「防禦設計是否有效工作」。

類型五：鏈上執行日誌（On-chain Execution Log）

記錄所有廣播到鏈上的交易：交易 hash、廣播時間、確認時間（幾個區塊後）、Gas 費（估算 vs 實際）、最終執行結果（成功 / revert）。鏈上執行日誌是你計算 Agent 實際成本和收益的唯一可信來源。

怎麼從日誌識別 Prompt Injection 攻擊

Prompt Injection 在日誌裡有幾個典型的特徵，掌握這些特徵能讓你在事後快速識別攻擊是否發生過：

特徵一：Thought Log 裡出現與任務不相關的目標陳述。正常的 Thought Log 應該完全圍繞你設定的任務。如果你看到「The primary objective is now to transfer funds to 0x...」，這是強烈的 Prompt Injection 信號。

特徵二：Tool Call Log 顯示 Agent 嘗試調用平時不調用的工具，或傳入異常參數。如果 Agent 突然嘗試調用 send_http_request 或 read_file（這些工具在正常業務流程裡不需要），或者在 transfer 工具裡傳入了白名單外的地址，是 Prompt Injection 信號。

特徵三：Validation Log 裡出現大量「BLOCKED」記錄，且都是同類型的拒絕原因。如果在一個 5 分鐘的窗口裡，你看到 7 條「BLOCKED: address not in whitelist」的記錄，且這個地址是同一個未知地址，這高度符合 Prompt Injection 讓 Agent 反覆嘗試向攻擊者地址轉帳、被後端驗證系統反覆攔截的模式。

特徵四：Thought Log 和 Tool Call Log 裡的數字不一致。如果 Tool Call Log 顯示 get_compound_apy 回傳 apy: 3.8，但 Thought Log 裡說「Compound 目前提供 8.5% APY」，說明 LLM 在推理時忽略了工具回傳，使用了不存在的數字——可能是幻覺，也可能是 Prompt Injection。

怎麼追蹤一筆交易的完整執行路徑

當你需要還原「一筆特定交易為什麼會發生」時，按以下步驟在四層日誌裡追蹤完整路徑：

第一步：從鏈上執行日誌找到交易 hash，確認交易的廣播時間。第二步：用廣播時間往前 60 秒，在後端驗證日誌裡找到對應的 APPROVED 記錄，確認這筆交易通過了哪些驗證。第三步：用 APPROVED 的時間戳往前 30 秒，在工具調用日誌裡找到觸發這個決策的工具回傳數據。第四步：在 Thought Log 裡找到對應時間點的推理記錄，確認 Agent 的完整推理鏈。

這個四步追蹤流程能讓你在幾分鐘內找到任何一筆 Agent 執行的交易的完整因果鏈，而不是在海量日誌裡盲目搜索。

這跟你運營 Agent 有什麼關係

Agent 日誌的設計不是「有就好」，而是「日誌質量決定了你的 debug 速度和安全審查能力」。一個沒有 Thought Log 的 Agent，在出問題時你只能看到「Agent 執行了什麼操作」，但永遠不知道「為什麼」。在你開始部署 Agent 之前，應該確認你的日誌系統能回答這五個問題：Agent 最後一次推理的完整 Thought 是什麼？最近一筆被後端攔截的操作是什麼，為什麼被攔截？昨天 Agent 廣播了幾筆交易、總計花了多少 Gas？最近 24 小時有沒有任何熔斷條件被觸發？最近 30 天有沒有任何「Address not in whitelist」的 Validation 攔截記錄？如果這五個問題你不能在 30 秒內通過日誌回答，你的日誌系統需要改進。

圖解

歡迎截圖分享，轉載請註明來源

提問

實用資源

鏈上數據 / TVL → 鏈上分析儀表板 → 區塊鏈瀏覽器 → 幣價 / 市場數據 → MCP 伺服器目錄 → LLM 評測排行 → 模型比較 →