Bible Network Crypto DeFi Onchain RWA AI Agent Stablecoin Chain SAFU CryptoTax DeFAI AGI Claude Me Claude Skill Claude Design Claude Cowork
独立メディア
いかなるプロジェクトとも無提携
暗号資産のAIエージェントを解剖する:仕組み・リスク・経済モデル
aiagent-bible.com
最新
最初のオンチェーンAgentの構築方法:ゼロからの最小限実行可能アーキテクチャと、デプロイ前の確認チェックリスト  ·  2025年AI Agentモニタリング規制の全景:米国・EU・アジアの最新動向とオンチェーンAgent開発者への実際の影響  ·  DeFiにおけるAI Agentのハルシネーションはどれほど危険か:4つの発生源・実際の事例・防御設計  ·  オンチェーンAgentのGas最適化設計:バッチトランザクション・動態戦略・タイミング選択でAgentの手数料を60%削減  ·  Agentトークンエコノミー設計:なぜほとんどのAgentトークンが失敗するのか、そして良いトークン設計とはどのようなものか  ·  AI AgentのContext Window管理:なぜエージェントが「忘れる」のか、そして4つの解決策
risk

DeFiにおけるAI Agentのハルシネーションはどれほど危険か:4つの発生源・実際の事例・防御設計

30秒バージョン · 忙しい方へ
DeFi Agentのハルシネーションは単に「間違った答えを出した」だけでなく——不可逆なオンチェーントランザクションを直接トリガーします。防御はLLMをより賢くすることではなく、コード層にバックエンド検証を追加することです:LLMのツール呼び出し出力は数値整合性・ホワイトリスト・金額上限の審査を通過してからトランザクションをブロードキャストします。このコード層の防護はどんなSystem Promptの指示より信頼性が高いです。

詳しく読む +
01 · なぜ起きたのか?

Agentのハルシネーション率をテストする方法はありますか?特定のLLMがDeFiシナリオでのハルシネーション傾向をどのように評価しますか?

DeFi Agentのハルシネーション率を評価するいくつかの実際に実行可能な方法があります:

方法1:ツールグラウンディングテスト 明確なツール返却データを含むテストプロンプトのバッチを設計し(Contextに固定APY数値を提供)、LLMに推論させます。LLMのThoughtステップがContextの数値を正しく引用しているかを検証します。

方法2:針穴の中の針ハルシネーションテスト 重要な数値を非常に長いContext(50,000トークン)の中間に置き、LLMが正確に引用できるかを確認します。多くのLLMはContextが50%の容量を超えると、中間部分の引用精度が著しく低下します。

方法3:アブレーションテスト 同じタスクに対して「完全なツールデータを持つAgent」vs「ツール呼び出しが無効化されたAgent」の出力を比較し、ハルシネーションの確率を定量化します。

02 · 仕組みは?

ハルシネーション防御と過度な慎重さ(過剰拒否)のバランスをどのように取りますか?防御が強すぎるとAgentが何もしなくなります。

これはハルシネーション防御設計で最も難しいバランスの問題です。防御が弱すぎる:Agentがハルシネーションに基づいて誤った操作を実行し、資金損失リスクがあります。防御が強すぎる:Agentはデータが不確実なすべての状況で実行を拒否し、最終的に「何もしないAgent」になります。

正しいバランスを見つける原則:

防御の強度を操作の不可逆性に比例させる:読み取り操作には厳格なハルシネーション防御は不要——数値を誤って読んでもオンチェーンの結果はありません。書き込み操作(トランザクションのブロードキャスト)には最も厳格な防御が必要です。

数値偏差閾値の動的設定:操作金額に基づいて動的に設定します:小額操作($100未満)は10%の偏差を許容;大額操作($5,000超)は2%の偏差のみ許容。

03 · 自分にどう影響する?

どのLLMでハルシネーション問題が最も深刻ですか?どのLLMのハルシネーション率が最も低いですか?

DeFi Agentシナリオでは、異なるLLMにはハルシネーション傾向に著しい違いがありますが、これは一般的なHallucination Benchmarkだけでは評価できません——DeFi Agentのハルシネーションは主に「知識的ハルシネーション」ではなく「グラウンディングハルシネーション」(LLMがContextのツールデータを無視する)だからです。

実際のオンチェーンAgentのデプロイ経験から:Claude Opus 4のグラウンディングハルシネーション率が最も低く;Claude Sonnetは中程度;小型モデル(Claude Haiku・GPT-4o mini)のグラウンディングハルシネーション率は大型モデルより著しく高い。強力なグラウンディングルールとバックエンドの数値整合性検証を組み合わせれば、Claude SonnetでもDeFi Agentシナリオで十分に低いハルシネーション率を達成できます。

04 · どうすればいい?

Agentのハルシネーションがすでに誤ったオンチェーン操作を引き起こした場合、事後的にどのように対処すべきですか?

ハルシネーションがすでに不可逆なオンチェーン操作の損失を引き起こした場合、事後の処置には3つのレベルがあります:

即時措置(発見から1時間以内):Agentのすべての後続操作を停止;AgentのすべてのプロトコルへのERC-20無限承認を取り消す;現在の保有状況を評価します。

根本原因分析(24〜48時間):完全なログを取得し(Thoughtログ・ツール呼び出しログ・検証ログ)、ハルシネーションの完全な因果チェーンを再構築します:どのThoughtステップが存在しない数値を引用し始めたか?バックエンド検証層はトリガーされたか?

防御の強化(根本原因分析完了後):根本原因分析の結果に基づいて、防御を的を絞って強化します。強化後、まずテストネットで48〜72時間実行して問題が再発しないことを確認してから、メインネットのAgentを再起動します。

全文 +

通常のAI対話でのハルシネーション(幻覚)の結果は通常「間違った答えを提供した」というものです——もう一度聞くか自分で調べれば間違いを発見できます。DeFi Agentのシナリオでは、ハルシネーションの結果は全く異なります:Agentが「想像した」APYの数値に基づいてリバランスを決定し、そのリバランスは実際のオンチェーントランザクションであり、一度ブロードキャストされると取り消せません。Agentのハルシネーション + オンチェーンの不可逆性 = 実際の資金損失リスクです。

この記事は「LLMにはハルシネーションがあるからAgentで資金を管理できない」と言うのではなく——DeFi Agentのハルシネーションの4つの発生源・各発生源の典型的な表れ方・有効なエンジニアリング防御方法を体系的に分析します。

Agentのハルシネーション問題とは何か

LLMのハルシネーションとは、モデルが「もっともらしく見えるが実際には正しくない」内容を生成することを指します。LLMはデータベースのように「クエリして結果を返す」のではなく、訓練データの統計的パターンに基づいてテキストを生成します。不確実な情報に遭遇したとき、「わかりません」と言う代わりに、「もっともらしく聞こえる」答えを生成する傾向があります——これが間違っている可能性があります。

DeFi Agentシナリオでは3つの特別な増幅要因があります:第一にAgentのアウトプットがオンチェーンOperationを直接トリガーする。第二にDeFiデータは高度に動的で、感知層が現在のデータを提供せず訓練記憶に頼ると、ハルシネーションはほぼ必然的です。第三にハルシネーションはAgentの推論チェーンで増幅される——ステップ1のハルシネーション(誤ったAPY)がステップ2の入力となり(誤ったAPYに基づくリバランス決定)、ステップ2の誤った決定がステップ3のオンチェーン操作をトリガーします。

DeFiでのハルシネーションが通常の会話より危険な理由

具体的な比較で危険度の違いを説明します:通常の会話でのハルシネーション——ユーザーが「イーサリアムはいつ設立されましたか?」と聞き、LLMが「2013年」と答える(やや不正確——白書は2013年だが、メインネットは2015年)。結果:財務損失なし。

DeFi Agentのハルシネーション——AgentのThoughtステップが「現在のデータによると、CompoundのUSDC APYは8.5%でAaveの4.2%より高い;リバランスを実行すべき」と述べます。しかしツールログは`get_compound_apy`が`apy: 3.8`を返したことを示しています——Agentはツールの返却を無視し、「記憶」の中の古い数値を使用しました。結果:実際にはAPYが低いプロトコルへのリバランスを実行し、Gas費が長期間の収益差を相殺します。このハルシネーションの直接コスト:Gas費$5-20 + 数週間の収益損失。

ハルシネーションの4つの発生源

発生源1:感知層のデータ欠如——LLMが訓練記憶で空白を埋める:最も一般的なハルシネーションの発生源。ツール呼び出しが失敗したとき、LLMは訓練データからの歴史的印象に基づく数値をThoughtステップで引用します。防御:ツール呼び出しが失敗したとき、LLMに「推論を続けさせる」のではなく、即座に今回のサイクルを中止し次回のリトライを待ちます。

発生源2:Context中間の情報が無視される(針穴の中の針問題):ContextWindowが長いとき、LLMはContextの中間の情報への注意力が最も弱くなります。防御:「最も重要な現在のデータ」をContextの末尾に置き(中間ではなく)、`<current_data>`タグに配置します。

発生源3:ツール返却データのフォーマットが非友好的——LLMの解析エラー:ツールが複雑なネストされたJSONを返すと、LLMは値の帰属を間違える可能性があります。防御:ツール関数でデータをフォーマットし、LLMが必要とする最小限のフィールドのみを渡します。

発生源4:Prompt Injectionによる偽データの注入:攻撃者がツール返却データに偽の数値情報を埋め込み、LLMに特定プロトコルのAPYが高いと信じさせます。防御:ツール返却データがContextに入る前に数値の合理性を検証し、異常値はContextに入れません。

ハルシネーション防御設計

防御1:ツールグラウンディング(Grounding)の強制:System Promptに「グラウンディングルール」を追加します:具体的な数値を含むすべての推論はツールが返したデータを引用し、データソースを明確に述べなければなりません;必要なデータのツール呼び出しが失敗した場合は実行を中止します。

防御2:バックエンドの数値整合性検証:LLMの各出力後・ツール実行前に「ThoughtとツールReturn数値の整合性検証」を行います:Thoughtで引用されたすべての数値を解析し、ツールログの実際の返却と比較;差異が5%を超える数値があればアラートを発し、ツール呼び出しの実行を拒否します。

防御3:重要データの複数ソースクロス検証:高影響の意思決定データについては、少なくとも2つの独立したデータソースから取得し、中央値または平均値を取ります;いずれかのソースが中央値から15%以上外れている場合はアラートを発し操作を停止します。

防御4:ツール返却値の合理性フィルタリング:ツール関数で返却値を合理的な範囲で検証します;範囲外の値はLLM Contextに入りません。ステーブルコインAPY:0〜30%(30%超はほぼ確実に異常);Gasコスト:0.1〜1000 Gwei。

これはあなたの資金にどう関係するか

DeFi Agentのハルシネーション防御は「LLMをより賢くすること」ではありません——LLM自体のハルシネーション傾向は技術的制限であり完全には排除できません。有効なハルシネーション防御とは「LLMのハルシネーションに対して十分な耐障害性を持つシステムを設計すること」です:たとえLLMがある推論サイクルでハルシネーションを生成しても、バックエンド検証層がそれを識別して遮断し、ハルシネーションによる推論が実際のオンチェーン操作をトリガーするのを防ぎます。

最も重要な実践:LLMに「オンチェーン操作を実行する」ツールを直接持たせないこと——LLMのツール呼び出し出力をまずバックエンドコード層の検証(数値整合性・ホワイトリスト・金額上限)に通してからオンチェーン操作を実行します。このバックエンド検証層はDeFi Agentの最も重要なハルシネーション防護壁です。

図解
DeFi Agent Hallucination: Four Sources + Four Defenses左側四種幻覺來源(感知缺失/大海撈針/解析錯誤/Prompt Injection)及典型表現;右側四層防禦設計(強制接地/數值一致性驗證/多源交叉驗證/合理性過濾)對應關係圖。DeFi Agent Hallucination: Four Sources → Four DefensesHallucination SourcesS1: Missing Perceive dataTool call fails → LLM fills with training memorySymptom: Thought cites APY not in tool logS2: Needle-in-haystack (long Context)LLM ignores tool data buried in middle of ContextSymptom: Tool returned correctly but Thought wrongS3: JSON parsing confusionComplex nested return → LLM mixes up ETH vs USDC APYSymptom: Plausible number but wrong asset typeS4: Prompt Injection (injected false data)Attacker embeds fake APY in tool returnSymptom: LLM believes untrue protocol superiorityDefense Design (code-layer, not prompt-layer)D1: Enforce grounding → counters S1 + S2System Prompt: 'cite tool source for ALL numbers'Tool fail → abort cycle, never continue reasoningD2: Backend consistency check → counters S1 + S3Parse all Thought numbers → diff vs tool log>5% deviation → alert + block tool executionD3: Multi-source cross-validation → counters S4Get APY from protocol API + DeFiLlama API>15% divergence → alert, do not executeD4: Reasonability filter → counters S3 + S4Stablecoin APY >30% → anomaly, use cached valueFilter before entering Context · not after LLM sees itKey insight: LLM hallucination can't be eliminated — design the system so hallucinations are intercepted before touching on-chain operationsAI Agent Bible · aiagent-bible.com
スクリーンショット歓迎。転載時は出典を明記してください。
質問する
10文字以上入力してください
関連記事
DeFiプロトコルがRug Pullしたとき、あなたのAgentは何をしているか:自動化戦略への4つの衝撃とAgent特有の防御設計
risk · 06/27
あなたのエージェントのフロントラン:MEVボットがAIエージェントのトレードを標的にするとき、損失はあなたが直接標的にされるより酷くなる可能性がある
risk · 06/15
オンチェーンAgentの最悪ケース防御設計:Agentが完全に侵害された場合、損失を許容範囲内に抑える方法
risk · 06/23
クリプトAIエージェントサービスの選び方:マーケティングの罠に騙されないための5つの評価フレームワーク
beginners · 06/22