Bible Network Crypto DeFi Onchain RWA AI Agent Stablecoin Chain SAFU CryptoTax DeFAI AGI Claude Me Claude Skill Claude Design Claude Cowork
独立メディア
いかなるプロジェクトとも無提携
暗号資産のAIエージェントを解剖する:仕組み・リスク・経済モデル
aiagent-bible.com
最新
オンチェーンAgentの最悪ケース防御設計:Agentが完全に侵害された場合、損失を許容範囲内に抑える方法  ·  クリプトAIエージェントサービスの選び方:マーケティングの罠に騙されないための5つの評価フレームワーク  ·  クリプトAgentローンチ前セキュリティチェックリスト:テストネットからメインネットまでの12の必須項目  ·  Agentウォレットの設計方法:4つのアーキテクチャの完全なリスクとコストの比較  ·  AutoGen vs LangChain vs ElizaOS:どれを選ぶか——クリプトAIエージェント開発者のための完全な意思決定ガイド  ·  エージェントメモリシステム設計:短期・長期・意味検索の3層アーキテクチャとクリプトシナリオのセキュリティ境界
fundamentals

Tool Use完全メカニズム解説:AIエージェントはどのように「行動」するか、そしてなぜこの設計が信頼できるかどうかを決定するのか

30秒バージョン · 忙しい方へ
AIエージェントのLLM自体はツールを実行しません——「何をしたいか」のリクエストを出力するだけで、実際の実行はバックエンドコードです。この設計はすべてのセキュリティの基盤:実行層はあなたのコントロール下にあり、セキュリティ検証はそこで追加されます。ツール設計の良し悪しがエージェントを信頼できるかどうかを決定します。

全文 +

AIエージェントの最も核心的な能力は「思考」ではなく「行動」です。思考はLLMのテキスト予測に過ぎませんが、行動こそがエージェントと現実世界を結びつけるメカニズムです。Tool Use(ツール呼び出し)はこのメカニズムの実装方法です——エージェントが「何かをしたい」というリクエストをどのように発するか、外部システムがどのように実行するか、そして結果がエージェントの次の推論ステップにどのように影響するかを定義します。

Tool Useの動作原理を理解することは、単なる技術的な問題ではありません。クリプトシナリオでは、Tool Useの設計が「エージェントがあなたの知らないうちに資産を動かせるかどうか」を直接決定します。

Tool Useとは何か:概念から実装まで

Tool Useのコンセプトは直感的です:LLMに「ツールリスト」を与え「これらのツールを呼び出せる」と伝えます。ツールは何でも構いません——ETHの現在価格を照会するAPI、Aaveの預金利率を読み取る関数、トランザクションに署名するインターフェース、さらにはメールを送信する能力。実装は4つのステップで展開されます:第一、System PromptまたはAPIパラメータで、LLMにどのツールが存在するか、名前、機能の説明、パラメータ形式を伝えます。第二、LLMが推論中に「今ツールを呼び出す必要がある」と判断すると、ツールを直接実行せず、「ツール呼び出しリクエスト」という構造化された出力を生成します——通常はJSON形式で、どのツールを呼び出すかとパラメータを指定します。第三、あなたのアプリケーションコード(LLMではない)がこのリクエストを読み取り、実際にツールを実行します。第四、ツールの返り値をLLMのコンテキストに戻し、続きの推論を行います。

重要なポイント:LLM自体はツールを実行しません。「何をしたいか」を言うだけで、実際の実行はバックエンドコードです。この設計は遠回りに見えますが、セキュリティの基盤です——実行層があなたのコントロール下にあり、セキュリティ検証ロジックを自由に追加できます。

Function CallingとTool Use:名前の違いと本質の共通点

「Function Calling」(OpenAIの用語)と「Tool Use」(Anthropic Claudeの用語)を同時に見かけて混乱するかもしれません。本質的には、どちらも同じ問題を解決しており、メカニズムはほぼ同じです。違いは主にAPI設計とフォーマットの詳細にあります。MCP(Model Context Protocol)はその上にさらに標準化の層を追加します——Function CallingやTool Useを置き換えるのではなく、ツールの定義と配布を標準化し、同じツールが異なるLLMやエージェントフレームワークから呼び出せるようにします。ユーザー視点で最も重要なのは:どのモデルが使われていても、現代のAIエージェントはほぼすべて類似のメカニズムを通じてLLMにツール呼び出しを可能にしているということです。

ツール呼び出しのセキュリティ境界:誰が何を実行する権限を持つか

Tool Useで最も重要なセキュリティの問題は「ツールを呼び出せるか」ではなく「ツール呼び出しの結果が検証されているか」です。いくつかの重要なセキュリティ設計の次元があります。

ツールの分類管理:ツールを「読み取り専用ツール」(価格照会、オンチェーン状態、データ検索)と「書き込みツール」(トランザクション署名、資金移動、設定変更)に分けます。読み取り専用ツールのエラーの結果は誤情報のみ;書き込みツールのエラーの結果は資産損失の可能性があります。この2つのカテゴリには異なる認可と検証メカニズムが必要です。

パラメータ検証:LLMが生成したツール呼び出しリクエストは実行前にパラメータの妥当性を検証する必要があります。エージェントが「送金」ツールを呼び出そうとするが、パラメータの受取アドレスがホワイトリストにない、または金額が設定上限を超えている場合——このリクエストは実行されるのではなくブロックされる必要があります。

ツール呼び出しのログ記録:すべてのツール呼び出し(リクエストパラメータと返り値を含む)が完全に記録される必要があります。これは事後監査の基盤であり——エージェントが予期しない操作をした場合、ログによって正確にどのツールが呼び出され、どのパラメータで、何が返されたかを追跡できます。

返り値の信頼性検証:ツールの返り値を無条件に受け入れるべきではありません。価格照会ツールが突然「ETH = $0.01」を返した場合、この結果はエージェントが次の決定を誤ったデータに基づいて行うのではなく、異常処理をトリガーする必要があります。プロンプトインジェクション攻撃の核心メカニズムはまさにツールの返り値を汚染することです。

クリプトシナリオのツール設計実践

実際のクリプトエージェントのデプロイでは、ツール設計はいくつかの共通パターンに従います。

第一、階層的な認可:照会ツール(DEX価格、オンチェーン状態、ガス代見積もり)は追加承認不要でエージェントが自由に呼び出せます;計算ツール(戦略評価、リスク計算)も同様に自由;実行ツール(トランザクション署名、資金移動)は追加の承認ゲートを通過する必要があります——金額閾値($100超は確認が必要)、タイムロック(業務時間外の大規模操作の遅延確認)、または承認されたコントラクトのホワイトリスト。

第二、ツールサンドボックス:隔離されたテスト環境でツール呼び出しを「ドライラン」します——オンチェーンにブロードキャストせずに取引実行をシミュレートし、エージェントが期待される結果を確認してから実際に実行します。これにより、本番環境に移行する前にツールの動作を確認できます。

第三、手数料上限チェック:ガス代を含むオンチェーンツールを実行する前に、まずガス見積もりツールでコストを計算し、プリセットの「最大許容ガス代」と比較します。手数料が期待を超える場合は実行を拒否し、ガス代スパイク時の予期しないコスト超過を防ぎます。

これはあなたのお金にどう関係するか

AIエージェントサービスを使用または評価する場合、Tool Useの設計品質がセキュリティに直接影響します。エージェントシステムのツール設計を評価する際、以下の質問をしてください:このエージェントのツールリストは「読み取り専用」と「書き込み」ツールを明確に区別していますか?書き込みツール(特にオンチェーン署名)に独立した承認検証がありますか?ツール呼び出しが完全にログ記録され監査可能ですか?ツールの返り値は異常な結果が直接採用されないよう妥当性検証されていますか?これらすべてに明確な答えがあれば、そのシステムのツール設計は信頼に値します。

図解
Tool Use Flow: LLM Request → Backend Execution → ResultTool Use 完整流程圖:LLM 輸出工具調用請求 → 後端程式碼執行工具 → 結果回傳 → LLM 繼續推理。標示安全驗證介入點(參數驗證、白名單、金額上限、日誌)和兩類工具的不同處理路徑。Tool Use Flow: LLM Request → Execution → ResultLLMReasoningOutputs tool requestJSONSecurity GateParam validationWhitelist check · Cap checkBackend CodeExecutes toolAPI / function / chainResult + ValidationPlausibility checkLog · Feed back to LLMResult back to LLM contextRead-Only Tools (free to call)get_price()get_balance()estimate_gas()get_apy()search_data()read_contract()Wrong result → bad reasoning onlyWrite Tools (require gate) ⚠sign_tx()transfer()approve()Amount cap · Whitelist · ConfirmationDry run first · Log every callWrong result → asset lossLLM does NOT execute tools — your backend code does. Security lives in the execution layer.Every tool call must be logged · Parameters validated · Results verified before LLM acts on themAI Agent Bible · aiagent-bible.com
スクリーンショット歓迎。転載時は出典を明記してください。
質問する
10文字以上入力してください
関連記事
AIエージェントはどう考えるか:ReAct推論フレームワークの完全解説と、エージェントが本当に仕事をこなせるかどうかを左右する理由
fundamentals · 06/15
オンチェーンAgentの最悪ケース防御設計:Agentが完全に侵害された場合、損失を許容範囲内に抑える方法
risk · 06/23
クリプトAIエージェントサービスの選び方:マーケティングの罠に騙されないための5つの評価フレームワーク
beginners · 06/22
クリプトAgentローンチ前セキュリティチェックリスト:テストネットからメインネットまでの12の必須項目
developers · 06/22
関連ニュース
関連トピック
MCPのセキュリティと権限管理:エンタープライズ展開前に解決すべき7つの問題
Claude Me
MCPセキュリティのコア原則は複雑ではありません:最小権限(必要なものだけを与える)、可逆性(高リスク操作を確認する)、監査(何をしたかを記録する)。これらの3つの原則を適切に実施すれば、MCPのエンタープライズ展開リスクは許容範囲内でコントロールできます。
#automation#claude-code#hack
MCPのセキュリティと権限管理:コントロールを失わずにAIがツールを操作できるようにする
Claude Me
MCPセキュリティ管理で最も重要な1つの原則:読み取りと書き込みの操作を別々に扱う。読み取りはClaudeに直接実行させ、書き込み、変更、削除については先に何をするか教えてもらいます——不可逆的な操作は常にあなたの明示的な確認が必要です。
#automation#claude-code#hack
1つの原稿が5つのフォーマットに:Claudeでコンテンツ再利用ワークフローを構築し、書く言葉を最大限に活用する
Claude Cowork Me
3時間かけて研究した洞察が3人にしか見られない——最も一般的な職場の時間の無駄です。Claudeを使って同じ分析を5つのフォーマットに変換し、上司・クライアント・同僚・業界コミュニティに届けましょう。影響力5倍、時間は20%増加だけです。
#automation#claude-code
毎日ブリーフィング自動化:仕事を始める前にClaudeが今日の最重要情報をまとめておく
Claude Cowork Me
職場での効率が低い人は、努力が足りないのではなく、毎日何が最も重要かわからないまま始めることが多いです。毎日3分のブリーフィング習慣で、タスクの山ではなく明確な方向性を持って一日を始められます。
#automation#claude-code