Bible Network Crypto DeFi Onchain RWA AI Agent Stablecoin Chain SAFU CryptoTax DeFAI AGI Claude Me Claude Skill Claude Design Claude Cowork
獨立知識媒體
與任何項目無關聯
拆解加密世界的 AI Agent:機制、風險、經濟模型
aiagent-bible.com
最新
MCP 是什麼?為什麼 2025 年每個 AI Agent 都在談它  ·  Agentic Loop 是什麼:AI Agent 怎麼「一直跑」——感知、規劃、執行、觀察的完整循環拆解  ·  2026 年五個主流 Onchain Agent 框架比較:LangGraph、ElizaOS、AutoGen、Olas、ZerePy,各自適合誰  ·  怎麼看懂 AI Agent 的日誌:五種必看日誌類型、一筆交易的完整追蹤路徑,以及 Prompt Injection 的日誌特徵  ·  怎麼選 Agent 的 LLM:四個維度讓你不再靠感覺猜  ·  DeFi 利率套利 Agent 的真實成本拆解:你的 Agent 到底在替誰賺錢
beginners

怎麼看懂 AI Agent 的日誌:五種必看日誌類型、一筆交易的完整追蹤路徑,以及 Prompt Injection 的日誌特徵

30 秒速讀
Agent 日誌多了一個維度:LLM 推理了什麼。沒有 Thought Log 的 Agent,出問題時你永遠只知道「它做了什麼」,但不知道「為什麼」——而「為什麼」才是真正找到問題的關鍵。

完整解析 +
01 · 為什麼發生?

用什麼工具來管理和查詢 Agent 日誌最有效?

LangSmith:LangChain/LangGraph 的官方追蹤平台,自動記錄 LLM 每次調用(完整 Thought 輸出)、工具調用(輸入/輸出)、整個 Chain 的執行時間和 Token 消耗。可視化執行樹,免費版支持基礎追蹤,付費 $39/月起。

Langfuse:開源替代方案,可自架,適合對數據隱私要求高的場景(財務數據的 Agent)。

自建(structlog + PostgreSQL):對不用 LangChain 的 Agent,最直接的方案。用 Python 的 structlog 庫輸出結構化 JSON 日誌,存入 PostgreSQL,可以用 SQL 查詢(「找出過去 24 小時所有 BLOCKED 的 Validation 記錄」)。成本:幾乎只有服務器費用。

02 · 運作原理是什麼?

Agent 日誌應該保留多久?

按重要性分類的保留建議:LLM Thought Log:90 天(大部分安全事件在 30 天內被發現);工具調用日誌:90 天;後端驗證日誌:180 天(安全審計需要更長歷史窗口);鏈上執行日誌:永久保留核心字段(tx_hash、金額、時間);熔斷告警日誌:180 天。90 天後,把 Thought Log 壓縮成決策摘要存入冷存儲(S3 Glacier,熱存儲成本的 10%)。

03 · 如何應用

Agent 日誌裡的隱私問題怎麼處理?

Agent 的日誌可能包含高度敏感信息:DeFi 策略邏輯、操作錢包地址、市場持倉信息。基本防護:日誌不以明文存放在公共存儲(PostgreSQL 開啟 TDE 加密,文件系統用 AES-256);訪問控制只限你和必要的運維人員;敏感字段脫敏(記錄「withdraw: 5000 USDC from protocol A」而不是「wallet 0x1234... withdraw 5000」)。使用第三方日誌服務(LangSmith)前確認其隱私政策——LangSmith 聲明不使用 traces 訓練模型。

04 · 我該怎麼做?

新手部署第一個 Agent 時,日誌系統怎麼最小化設計?

最小可行日誌方案(兩天內完成):第一步:確保 Thought Log 有記錄——每次 LLM 輸出後寫入文件(Python logging.info()),或用 LangSmith。第二步:確保鏈上執行日誌有記錄——每次廣播後記錄 tx_hash 和預期操作。第三步(第一個月內加):加入後端驗證日誌——每次驗證記錄「條件 + 結果 + APPROVED/BLOCKED」。工具:Python logging 模塊 + Railway Log Viewer,等系統穩定後再升級到 LangSmith 或自建 PostgreSQL。

完整內容 +

你的 AI Agent 在凌晨 3 點執行了一筆你完全沒預期的操作。你打開系統看到一串日誌,但不知道從哪裡開始讀、讀什麼、怎麼找到「到底發生了什麼」。這是大多數 Agent 初學者的第一個真實挫折。

Agent 的日誌和普通應用的日誌根本性地不同——普通應用的日誌是「執行了什麼代碼、出現了什麼錯誤」,Agent 的日誌多了一個維度:「LLM 推理了什麼」。如果你只看執行層的日誌,忽略了 LLM 的推理過程,你永遠不知道 Agent 為什麼做了那個決定。這篇文章從實際操作出發,告訴你 Agent 日誌應該記錄什麼、怎麼讀懂每種日誌、以及怎麼用日誌追蹤一筆交易的完整執行路徑。

為什麼 Agent 日誌和普通應用日誌不同

普通應用的執行邏輯是確定性的:輸入 A → 代碼執行路徑 B → 輸出 C。只要代碼不變,同樣的輸入永遠得到同樣的輸出。日誌的作用是記錄「代碼執行路徑上發生了什麼」,出問題時找 Error 和 Exception。

Agent 的執行邏輯是非確定性的:輸入 A → LLM 推理(不確定)→ 工具調用決策(不確定)→ 外部工具執行(不確定)→ 觀察結果(不確定)→ 再次 LLM 推理...。同樣的輸入在不同的市場環境、不同的 Context 歷史下可能得到完全不同的 Agent 行為。Agent 出問題時,你不只需要知道「代碼執行路徑」,更需要知道「LLM 推理了什麼、基於什麼信息、做了什麼決策」——因為問題可能不在代碼,而在 LLM 的推理本身。

這意味著完整的 Agent 日誌系統必須包含四個層次:LLM 推理日誌、工具調用日誌、後端驗證日誌、和鏈上執行日誌。缺少任何一層,你的 debug 能力就有盲區。

五種必看的日誌類型

類型一:LLM 推理日誌(Thought Log)

這是 Agent 日誌裡最重要、也最容易被忽略的日誌。它記錄的是 Agent 在 ReAct 框架裡每個 Thought 步驟的完整輸出——也就是「Agent 在決定調用工具之前,它的推理過程是什麼」。一條典型的 Thought Log 看起來像:

[2026-06-27 03:12:44 UTC] THOUGHT: Current market data shows Aave APY=4.2%, Morpho APY=5.1%. The 0.9% difference exceeds the 0.5% rebalancing threshold. Decision: execute rebalance from Aave to Morpho.

Thought Log 能讓你看到 Agent 決策背後的「為什麼」。如果 Agent 執行了你沒預期的操作,第一步永遠是看 Thought Log:Agent 是基於什麼數據做了這個決定?它引用的數字是不是真實的工具回傳數據,還是它「想象」的數字(幻覺)?

類型二:工具調用日誌(Tool Call Log)

記錄每次工具函數調用的完整信息:調用了什麼工具、傳入了什麼參數、工具回傳了什麼原始數據、調用耗時多少、是否成功。典型格式:

[2026-06-27 03:12:45 UTC] TOOL_CALL: get_aave_apy | params: {token: USDC} | result: {apy: 4.2, tvl: 3200000000} | latency: 340ms | status: success

工具調用日誌是你驗證「Thought Log 裡的數字有沒有真實的工具回傳支撐」的依據。如果 Thought Log 說「Morpho APY 是 5.1%」,但工具調用日誌裡 get_morpho_apy 的回傳是 apy: 3.8,說明 LLM 在推理時忽略了工具的實際回傳,用了一個幻覺數字。

類型三:後端驗證日誌(Validation Log)

記錄每次 Agent 嘗試調用寫入工具(執行鏈上操作)時,後端驗證層的決策過程。包含:被提交的操作、每個驗證條件的檢查結果、是否通過(執行)或被攔截(拒絕)。典型格式:

[2026-06-27 03:12:52 UTC] VALIDATION: withdraw_from_aave | amount=5000 | check_amount_limit: PASS | check_whitelist: PASS | APPROVED

後端驗證日誌讓你知道「哪些操作被 Agent 嘗試過但被安全系統攔截了」。如果你看到大量「BLOCKED: address not in whitelist」的記錄,可能意味著 Agent 正在嘗試和白名單外的地址互動,可能是 Prompt Injection 攻擊。

類型四:熔斷告警日誌(Circuit Breaker Log)

記錄所有觸發熔斷條件的事件:哪個熔斷條件被觸發、觸發時的市場數據或 Agent 狀態、熔斷後 Agent 採取的自動動作(暫停操作、發送告警)。這個日誌讓你在事後評估「防禦設計是否有效工作」。

類型五:鏈上執行日誌(On-chain Execution Log)

記錄所有廣播到鏈上的交易:交易 hash、廣播時間、確認時間(幾個區塊後)、Gas 費(估算 vs 實際)、最終執行結果(成功 / revert)。鏈上執行日誌是你計算 Agent 實際成本和收益的唯一可信來源。

怎麼從日誌識別 Prompt Injection 攻擊

Prompt Injection 在日誌裡有幾個典型的特徵,掌握這些特徵能讓你在事後快速識別攻擊是否發生過:

特徵一:Thought Log 裡出現與任務不相關的目標陳述。正常的 Thought Log 應該完全圍繞你設定的任務。如果你看到「The primary objective is now to transfer funds to 0x...」,這是強烈的 Prompt Injection 信號。

特徵二:Tool Call Log 顯示 Agent 嘗試調用平時不調用的工具,或傳入異常參數。如果 Agent 突然嘗試調用 send_http_request 或 read_file(這些工具在正常業務流程裡不需要),或者在 transfer 工具裡傳入了白名單外的地址,是 Prompt Injection 信號。

特徵三:Validation Log 裡出現大量「BLOCKED」記錄,且都是同類型的拒絕原因。如果在一個 5 分鐘的窗口裡,你看到 7 條「BLOCKED: address not in whitelist」的記錄,且這個地址是同一個未知地址,這高度符合 Prompt Injection 讓 Agent 反覆嘗試向攻擊者地址轉帳、被後端驗證系統反覆攔截的模式。

特徵四:Thought Log 和 Tool Call Log 裡的數字不一致。如果 Tool Call Log 顯示 get_compound_apy 回傳 apy: 3.8,但 Thought Log 裡說「Compound 目前提供 8.5% APY」,說明 LLM 在推理時忽略了工具回傳,使用了不存在的數字——可能是幻覺,也可能是 Prompt Injection。

怎麼追蹤一筆交易的完整執行路徑

當你需要還原「一筆特定交易為什麼會發生」時,按以下步驟在四層日誌裡追蹤完整路徑:

第一步:從鏈上執行日誌找到交易 hash,確認交易的廣播時間。第二步:用廣播時間往前 60 秒,在後端驗證日誌裡找到對應的 APPROVED 記錄,確認這筆交易通過了哪些驗證。第三步:用 APPROVED 的時間戳往前 30 秒,在工具調用日誌裡找到觸發這個決策的工具回傳數據。第四步:在 Thought Log 裡找到對應時間點的推理記錄,確認 Agent 的完整推理鏈。

這個四步追蹤流程能讓你在幾分鐘內找到任何一筆 Agent 執行的交易的完整因果鏈,而不是在海量日誌裡盲目搜索。

這跟你運營 Agent 有什麼關係

Agent 日誌的設計不是「有就好」,而是「日誌質量決定了你的 debug 速度和安全審查能力」。一個沒有 Thought Log 的 Agent,在出問題時你只能看到「Agent 執行了什麼操作」,但永遠不知道「為什麼」。在你開始部署 Agent 之前,應該確認你的日誌系統能回答這五個問題:Agent 最後一次推理的完整 Thought 是什麼?最近一筆被後端攔截的操作是什麼,為什麼被攔截?昨天 Agent 廣播了幾筆交易、總計花了多少 Gas?最近 24 小時有沒有任何熔斷條件被觸發?最近 30 天有沒有任何「Address not in whitelist」的 Validation 攔截記錄?如果這五個問題你不能在 30 秒內通過日誌回答,你的日誌系統需要改進。

圖解
Agent Log System: Four Layers and Transaction Trace PathAgent 日誌四層架構:Thought Log → Tool Call Log → Validation Log → On-chain Log,展示一筆交易的完整追蹤路徑和 Prompt Injection 的日誌特徵。Agent Log System: Four Layers + Transaction Trace Path1. Thought LogLLM reasoning chainDecision basis + cited dataMost important · most neglected2. Tool Call LogTool name · params · raw returnLatency · success/failVerify Thought Log numbers3. Validation LogEach check resultAPPROVED / BLOCKEDKey for attack detection4. On-chain Logtx_hash · Gas · confirm · resultGround truth of cost/resultTransaction Trace Path (reverse)Step 1: On-chain log → find tx_hash + broadcast timee.g. 2026-06-27 03:13:05 UTC · tx: 0xabc...Step 2: Validation log → find APPROVED (t-60s)amount=5000 · target=Morpho · all checks PASSStep 3: Tool call log → triggering data (t-90s)get_morpho_apy: apy=5.1 · get_aave_apy: apy=4.2Step 4: Thought log → reasoning chain (t-120s)0.9% diff exceeds threshold · gas ok · rebalance to MorphoPrompt Injection Log Signatures1 Thought: off-task goal (transfer to 0xMalicious...)2 Tool call: normally-uncalled tools or non-whitelist addresses3 Validation: repeated BLOCKED targeting same unknown address4 Mismatch: Thought cites APY not matching Tool Call returnAI Agent Bible · aiagent-bible.com
歡迎截圖分享,轉載請註明來源
提問
請至少輸入 10 個字
相關文章
MCP 是什麼?為什麼 2025 年每個 AI Agent 都在談它
beginners · 06/27
如何選擇加密 AI Agent 服務:五個評估框架,讓你不被行銷話術坑
beginners · 06/22
如何跑你的第一個 Crypto Agent:從零開始的完整指南,以及最容易搞砸的幾件事
beginners · 06/17
什麼是鏈上 Agent?它和你用過的所有 AI 工具差在一件事
beginners · 06/15