Bible Network Crypto DeFi Onchain RWA AI Agent Stablecoin Chain SAFU CryptoTax DeFAI AGI Claude Me Claude Skill Claude Design Claude Cowork
独立メディア
いかなるプロジェクトとも無提携
暗号資産のAIエージェントを解剖する:仕組み・リスク・経済モデル
aiagent-bible.com
最新
オンチェーンAgentの最悪ケース防御設計:Agentが完全に侵害された場合、損失を許容範囲内に抑える方法  ·  クリプトAIエージェントサービスの選び方:マーケティングの罠に騙されないための5つの評価フレームワーク  ·  クリプトAgentローンチ前セキュリティチェックリスト:テストネットからメインネットまでの12の必須項目  ·  Agentウォレットの設計方法:4つのアーキテクチャの完全なリスクとコストの比較  ·  AutoGen vs LangChain vs ElizaOS:どれを選ぶか——クリプトAIエージェント開発者のための完全な意思決定ガイド  ·  エージェントメモリシステム設計:短期・長期・意味検索の3層アーキテクチャとクリプトシナリオのセキュリティ境界
用語解説 · エージェントの構造と推論

LLM (Large Language Model)

LLM(大規模言語モデル)
エージェントの構造と推論 進階

詳しく読む +
01 · これは何?

LLMと従来の機械学習モデルの根本的な違いは何ですか?「次のトークンを予測する」ことがどうして「思考」のように見える出力を生み出すのですか?

従来の機械学習モデル(分類器・回帰モデル)は「特定のフォーマットのデータを入力して、特定のラベルや数値を出力する」ように設計されています——例えば「画像を入力して、猫か犬かを出力する」。これらのモデルの能力は訓練目的に厳格に制限されており、訓練されていないタスクへの汎化はできません。

LLMの設計の本質は「前のすべてのテキストが与えられた時、次の最も可能性の高いトークンを予測する」ことです。この目標は非常にシンプルに見えますが、予期しない創発効果をもたらします:大量のテキストで次のトークンを正確に予測するために、モデルは言語の文法・意味・世界知識・因果推論・論理的一貫性を「学ばなければなりません」——誰かが明示的に教えたからではなく、正確な予測にこれらの知識が必要だからです。

結果として:LLMに質問すると、各トークンを生成する際に「訓練分布の中で、この質問に続く最も可能性の高い回答を見つける」ことを実質的に行っています。このプロセスには真の「理解」や「意識」はありませんが、外部から観察すると、実際に推論しているシステムに非常に近い出力になります。

AIエージェントへの意味:この本質を理解することで、LLMがなぜ「幻覚」を起こすかがわかります——嘘をついているのではなく、たとえ事実として間違っていても「統計的に合理的な答えのように見えるテキスト」を生成しているのです。

02 · なぜ存在する?

LLMの「幻覚」(Hallucination)とは何ですか?クリプトAgentシナリオでは、幻覚の結果は通常の使用シナリオよりどれほど深刻ですか?

幻覚とは、LLMがもっともらしく自信を持って聞こえるが、事実として不正確なコンテンツを生成することを指します。幻覚はバグではなく、LLMの統計的な本質の必然的な副産物です——各トークンを生成する際に、モデルは「事実の正確さ」ではなく「統計的な信憑性」を最適化します。モデルがある答えを裏付ける信頼できるデータを持っていない場合でも、「答えのように見える」テキストを生成します。

よくある幻覚のパターン:捏造されたデータ(例:「Aaveの現在のUSDC利率はX%」——モデルが調べたのではなく「合理的に推測した」数字);誤った因果推論(相関を因果として扱う);不確かなことを過度に自信を持って述べる。

クリプトAgentシナリオでは幻覚の結果がはるかに深刻です:通常の使用では幻覚の最悪の結果は間違った情報を得ることで後で確認できます。しかしクリプトAgentでは、LLMの幻覚が直接オンチェーン操作をトリガーする可能性があります——例えばAgentがAaveの利率「12%」を幻覚し、即座に低利率プロトコルからAaveへのリバランスを実行しますが、実際のAaveの利率は4%しかなく、ガス代が純損失を生じさせます。

防御設計:市場データやオンチェーン状態に関するすべての判断は、ツールから返されたリアルタイムデータから取得する必要があり、LLMが訓練データの数字を「記憶から」使用してはなりません。

03 · 意思決定にどう影響する?

異なるLLM(GPT-4、Claude、Gemini)はAIエージェントのユースケースでどのような顕著な違いがありますか?モデルを選ぶ際にどのような次元を考慮すべきですか?

Agentシナリオでは、LLMの選択は「どちらがよりスマートか」だけでなく、いくつかの具体的な次元を評価する必要があります。

Context Windowのサイズ:AgentのcontextはSystem Prompt・ツール定義・会話履歴・ツールの返答を含み、実際の消費は速いです。Claudeの200Kトークンのcontext windowは、長文書の分析や長期的な会話記憶が必要なシナリオで明確な優位性を持ちます。

Tool Useの安定性:すべてのLLMが正しいフォーマットのツール呼び出しリクエストを確実に出力できるわけではありません。GPT-4のツール呼び出しエコシステムが最も成熟しており、Claudeはツール呼び出しのフォーマット遵守とエラー回復において安定したパフォーマンスを発揮します。

指示遵守:AgentのSystem Promptは通常長く複雑で、推論全体を通じてLLMが設定されたルールを継続的に遵守する必要があります。異なるモデルは長いコンテキスト下での指示遵守において顕著な差があります。

レイテンシとコスト:高頻度Agent(毎分複数回の呼び出し)はレイテンシとコストに敏感です。フラッグシップモデル(GPT-4o、Claude Sonnet)はより大きなモデルより速度とコストで優れています。

04 · どうすればいい?

クリプトAgentのユースケースのためにLLMをファインチューニングすることと、優れたSystem Promptを持つ汎用LLMをそのまま使うことのどちらが価値がありますか?

絶対的な答えはありませんが、いくつかの判断フレームワークがあります。

ファインチューニングが投資に値するシナリオ:高品質なクリプトAgent操作データが大量にある(数千から数万の高品質なThought/Action/Observationサンプル);Agentが固定フォーマットの高度に反復的なタスクを実行する;レイテンシとコストに極めて厳格な要件がある(ファインチューニングされた小さなモデルは大きなモデルへのAPI呼び出しよりはるかに安い);大量のクリプトプロトコルの詳細をモデルに「記憶」させる必要がある。

汎用LLM + 優れたSystem Promptがより価値があるシナリオ:データ量が不十分(ファインチューニングは大量の高品質データが必要——少量のデータでは過学習を引き起こす可能性がある);Agentタスクが多様で予測不可能(汎用モデルの汎化能力が優れている);迅速な反復が必要(System Promptの変更は再ファインチューニングよりはるかに安い)。

2026年の実際的なアドバイス:ほとんどのクリプトAgent開発者にとって、ファインチューニングよりもツール設計・System Prompt最適化・メモリシステム設計に優先的に取り組むことをお勧めします。ファインチューニングは「良いAgentをより良くする」ための手段であり、「悪いAgentを良くする」近道ではありません。

具体例 +

実際のシナリオ:同じDeFi Agent、LLM交換後の動作の違い

以下の比較は、実際の開発シナリオでLLMの選択がAgentの動作にどう影響するかを示しています。

タスク:AgentがAave・Compound・Morphoの3つのプロトコルのUSDC利率を分析し、リバランスを実行するかどうかを決定し、推論プロセスを説明する。

GPT-4o-mini(低コスト)使用時の表現:ツール呼び出しのフォーマットは正確で、基本的な利率比較は機能します。しかし、「利率差がGas代をカバーするのに不十分な場合、明示的に実行を拒否して理由を説明する」というSystem Promptの指示に対して、利率差が非常に小さい場合でも「実行を推奨」と出力することがあり、Gas代を考慮しない場合があります——複雑な条件下での指示遵守が時に不安定であることを示しています。

Claude Sonnet(中程度のコスト)使用時の表現:同じSystem Promptで、Claudeは「Gas代の合理性判断」という複雑な条件推論においてより一貫しており、Gas代がスプレッド収益を超える場合に正確に実行を拒否し、より詳細な説明を提供します(計算プロセスを積極的にリストアップ)。

この比較はすべてのシナリオでClaudeが優れているということではなく、「複雑な条件判断」と「指示遵守」を必要とするAgentシナリオでは、LLMの違いが出力品質に実際の影響を与えることを示しています。

図解
LLM in AI Agent Architecture: Brain vs. HandsLLM 在 AI Agent 架構中的角色圖:LLM 作為推理層(大腦),工具層作為執行層(雙手),記憶層提供上下文,三者如何協作完成一個完整的 Agent 任務循環。LLM in AI Agent Architecture: Reasoning Brain vs. Execution HandsLLM (Reasoning Brain)Thinks · Plans · Interprets · DecidesGPT-4 · Claude · Gemini · Open-sourceMemory LayerContext windowVector DB · LogsTool Layer (Hands)Read tools · Write toolsMCP · APIs · ChainUser / HumanSets goals · Confirmshigh-risk operationsreads contextoutputs tool requestsnotifies for confirmationLLM Hallucination Risk in Crypto AgentsLLM never 'knows' real-time data — all prices, rates, Gas must come from tool queries, never from model memoryAI Agent Bible · aiagent-bible.com
スクリーンショット歓迎。転載時は出典を明記してください。
よくある誤解 +
✕ 誤解 1
× 誤解1:LLMは大きければ大きいほど良い——最大のモデルを使えばいい。モデルのサイズとタスクへの適合度は同様に重要です。7Bパラメータのファインチューニングされたモデルは、特定のクリプト分析タスクではGPT-4より速く、安く、同等のパフォーマンスを発揮する可能性があります。大きなモデルはより長いレイテンシとより高いコストをもたらします——高頻度呼び出しが必要なAgentには無視できない制約です。「最大のモデル」はAgent設計の答えではなく、「このタスクに最も適したモデル」が答えです。
✕ 誤解 2
× 誤解2:LLMが何かを「確認した」または「検証した」と言えば、それは本当のことです。LLMは何かを本当に「確認する」能力を持っていません——テキストを生成できるだけです。「AaveのレートがX%であることを確認しました」というのは、モデルが生成したテキストに過ぎず、実際にAaveのコントラクトを照会したことを意味しません。クリプトAgentでは、数値情報(利率・ガス代・価格)はすべてツールクエリから得る必要があります。
The Missing Link +
直接的な影響

AIエージェントアーキテクチャにおけるLLMの核心的なトレードオフは「能力の上限 vs コストとレイテンシ」です。より強力なLLM(より大きなパラメータ数、より長いcontext window)はより正確な推論とより良い指示遵守をもたらしますが、コストが高くなり推論レイテンシが長くなります。高頻度Agent(毎分複数回の呼び出し)では、フラッグシップモデルのコストがAgent全体のシステムを経済的に実行不可能にする可能性があります。もう一つのトレードオフは「汎化能力 vs 特定ドメインの深さ」:汎用LLMの汎化能力は予期しない状況をより良く処理しますが、クリプト特有の知識の深さはファインチューニングされたモデルには及びません。実際の設計推奨:モデル階層化を使用——複雑な推論ステップには強力なモデルを、シンプルなツール呼び出し判断には小さなモデルを使用し、能力とコストのバランスを取ります。

質問する
10文字以上入力してください
関連トピック
LLMは実際にどうやってテキストを生成するのか?非エンジニアへの本当の説明
Claude Me
LLMは「考えて」いるのではなく、1トークンずつ「次に最も可能性が高いものは何か」を予測しています。そのメカニズムが、これほど能力が高い理由であり、時に作り話をする理由でもあります。
#agent#ai
Claude Cowork実践入門:業務まるごとAIに任せつつ、最後の一歩で事故らせない方法
Claude Me
Coworkの真のハードルは「使い方」ではなく「間違えたとき受け止められるか」。目標を明確に伝え、途中にチェックポイントを置き、最後の送信は自分の手で——この三つが、助手か時限爆弾かを分けます。
#agent#ai
トレーニングがClaudeの「個性」をどう形成するか:事前学習からRLHFとConstitutional AIまでの完全な経路
Claude Me
Claudeの「誠実さの傾向」はエンジニアが設定したスイッチではありません——Constitutional AIトレーニング段階の直接的な産物です:「憲法」の明示的な誠実さの原則が、真実を告げる(ユーザーを不快にさせるかもしれない)と喜ばせる(しかし不誠実な)の間で、系統的に前者を好む傾向を生み出します。
#agent#ai
MCPとは何か?Claudeを現実世界に接続するプロトコル完全解説
Claude Me
MCPはClaudeを「話すだけのAI」から「行動できるAI」へと変えます——これはAIアシスタントにとって最も重要な進化です。
#agent#ai