beginners

AIエージェントのログの読み方：確認必須の5種類のログ・トランザクションの完全な追跡・Prompt Injectionのログ特徴

30秒バージョン · 忙しい方へ

エージェントのログには追加の次元があります：LLMが何を推論したか。Thoughtログなしでは問題が発生しても「何をしたか」しかわからず、「なぜ」は永遠にわかりません——「なぜ」こそが問題を本当に見つける鍵です。

Grace Patel · 2026年06月27日

詳しく読む +

01 · なぜ起きたのか？

Agentのログを管理・照会するのに最も効果的なツールは何ですか？

LangSmith：LangChain/LangGraphの公式トレースプラットフォーム。すべてのLLM呼び出し（完全なThought出力）・ツール呼び出しを自動記録。実行ツリーを可視化。無料版あり、有料は$39/月から。

Langfuse：オープンソースの代替案、自己ホスト可能。高データプライバシー要件のシナリオに適合。

カスタム（structlog + PostgreSQL）：LangChainを使わないAgentの最も直接的なアプローチ。Pythonのstructlogライブラリで構造化JSONログをPostgreSQLに出力。SQLでクエリ可能。

02 · 仕組みは？

Agentのログはどのくらいの期間保持すべきですか？

重要度別の保持推奨：LLM Thoughtログ：90日；ツール呼び出しログ：90日；バックエンド検証ログ：180日；オンチェーン実行ログ：コアフィールドを永続保持；サーキットブレーカーアラートログ：180日。90日後、ThoughtログをS3 Glacierなどのコールドストレージに圧縮・移動します。

03 · 自分にどう影響する？

Agentのログのプライバシー問題はどのように対処しますか？

AgentのログはDeFi戦略ロジック・操作ウォレットアドレス・市場ポジション情報などの高度に機密性の高い情報を含む可能性があります。基本的な保護：ログはパブリックストレージに平文で保存しない（PostgreSQLでTDE暗号化）；アクセスは必要な人員のみに制限；機密フィールドのマスキング（「wallet 0x1234...」ではなく「プロトコルAから5000 USDCを引き出す」と記録）。

04 · どうすればいい？

最初のAgentをデプロイする際、ログシステムをどのように最小限に設計しますか？

最小限の実行可能なログ計画（2日以内に完了）：ステップ1：Thoughtログが記録されることを確認——LLMの各出力後にファイルに書き込む（Python logging.info()）またはLangSmithを使用。ステップ2：オンチェーン実行ログが記録されることを確認——各ブロードキャスト後にtx_hashを記録。ステップ3（最初の1ヶ月以内）：バックエンド検証ログを追加——各検証に「条件+結果+APPROVED/BLOCKED」を記録。

全文 +

あなたのAIエージェントが午前3時に全く予期しなかった操作を実行しました。システムを開くとログが並んでいますが、どこから読み始めるか・何を読むか・何が起きたのかをどうやって見つけるかわかりません。これがほとんどのエージェント初心者が最初に直面する本当の挫折です。

エージェントのログは通常のアプリのログとは根本的に異なります——通常のログは「どのコードが実行され、どのエラーが発生したか」ですが、エージェントのログには追加の次元があります：「LLMが何を推論したか」。実行層のログだけを見てLLMの推論プロセスを無視すると、エージェントがなぜその決定を下したかは永遠にわかりません。

エージェントのログが通常のアプリケーションのログと異なる理由

通常のアプリケーションの実行ロジックは確定的です。エージェントの実行ロジックは非確定的です：入力A → LLM推論（不確定）→ ツール呼び出し決定（不確定）→ 外部ツール実行（不確定）→ 観察結果（不確定）→ 再LLM推論...。完全なエージェントのロギングシステムには4層が必要です：LLM推論ログ・ツール呼び出しログ・バックエンド検証ログ・オンチェーン実行ログ。

確認必須の5種類のログ

タイプ1：LLM推論ログ（Thoughtログ）

最も重要で最も見落とされがちなログです。ReActフレームワークの各Thoughtステップの完全な出力を記録します。典型的なThoughtログ：

[2026-06-27 03:12:44 UTC] THOUGHT: Current market data shows Aave APY=4.2%, Morpho APY=5.1%. Decision: execute rebalance from Aave to Morpho.

ThoughtログはAgentの決定の「なぜ」を示します。予期しない操作が実行された場合は、まずThoughtログを確認してください。

タイプ2：ツール呼び出しログ：各ツール関数呼び出しの完全な情報を記録します。ThoughtログとToolCallログの数値を照合して幻覚を検出します。

タイプ3：バックエンド検証ログ：Agentが書き込みツールを呼び出そうとするたびに、バックエンド検証層の意思決定プロセスを記録します。BLOCKED記録はセキュリティレビューの核心情報です。

タイプ4：サーキットブレーカーアラートログ：サーキットブレーカー条件をトリガーしたすべてのイベントを記録します。防御設計が有効に機能したか事後評価できます。

タイプ5：オンチェーン実行ログ：チェーンにブロードキャストされたすべてのトランザクションのハッシュ・コスト・結果を記録します。実際のコストと収益計算の唯一の信頼できる情報源です。

ログからPrompt Injection攻撃を識別する方法

Prompt Injectionの4つのログ特徴：Thoughtにタスクと無関係な目標陳述が出現する；ツール呼び出しログが通常は呼ばれないツールを示す；検証ログに同じアドレスへのBLOCKED記録が多数ある；ThoughtとToolCallログの数値が一致しない。これらの特徴を把握することで、事後に攻撃が発生したかどうかを素早く特定できます。

トランザクションの完全な実行パスを追跡する方法

4ステップの追跡プロセス：オンチェーンログでtx_hashを探す（ステップ1）→ 検証ログでt-60sのAPPROVEDを探す（ステップ2）→ ツール呼び出しログでt-90sのトリガーデータを探す（ステップ3）→ Thoughtログでt-120sの推論チェーンを確認する（ステップ4）。このプロセスにより数分以内に完全な因果チェーンを見つけられます。

これはあなたのAgent運用にどう関係するか

Agentのログ設計は「あれば良い」ではなく、「ログの質がデバッグ速度とセキュリティレビュー能力を決定する」ものです。デプロイ前に5つの質問に答えられるか確認してください：最後の完全なThoughtは何か？最も最近バックエンドでブロックされた操作は何か？昨日のトランザクション数とGasの合計は？過去24時間でサーキットブレーカーはトリガーされたか？過去30日間にホワイトリスト違反の記録はあるか？30秒以内に答えられない場合、ログシステムを改善する必要があります。

図解

スクリーンショット歓迎。転載時は出典を明記してください。

質問する

参考リンク

オンチェーンデータ / TVL → オンチェーン分析ダッシュボード → ブロックエクスプローラー → 価格 / 市場データ → MCPサーバー一覧 → LLMベンチマーク → モデル比較 →