risk

DeFiにおけるAI Agentのハルシネーションはどれほど危険か：4つの発生源・実際の事例・防御設計

30秒バージョン · 忙しい方へ

DeFi Agentのハルシネーションは単に「間違った答えを出した」だけでなく——不可逆なオンチェーントランザクションを直接トリガーします。防御はLLMをより賢くすることではなく、コード層にバックエンド検証を追加することです：LLMのツール呼び出し出力は数値整合性・ホワイトリスト・金額上限の審査を通過してからトランザクションをブロードキャストします。このコード層の防護はどんなSystem Promptの指示より信頼性が高いです。

Jordan Blake · 2026年06月29日

詳しく読む +

01 · なぜ起きたのか？

Agentのハルシネーション率をテストする方法はありますか？特定のLLMがDeFiシナリオでのハルシネーション傾向をどのように評価しますか？

DeFi Agentのハルシネーション率を評価するいくつかの実際に実行可能な方法があります：

方法1：ツールグラウンディングテスト 明確なツール返却データを含むテストプロンプトのバッチを設計し（Contextに固定APY数値を提供）、LLMに推論させます。LLMのThoughtステップがContextの数値を正しく引用しているかを検証します。

方法2：針穴の中の針ハルシネーションテスト 重要な数値を非常に長いContext（50,000トークン）の中間に置き、LLMが正確に引用できるかを確認します。多くのLLMはContextが50%の容量を超えると、中間部分の引用精度が著しく低下します。

方法3：アブレーションテスト 同じタスクに対して「完全なツールデータを持つAgent」vs「ツール呼び出しが無効化されたAgent」の出力を比較し、ハルシネーションの確率を定量化します。

02 · 仕組みは？

ハルシネーション防御と過度な慎重さ（過剰拒否）のバランスをどのように取りますか？防御が強すぎるとAgentが何もしなくなります。

これはハルシネーション防御設計で最も難しいバランスの問題です。防御が弱すぎる：Agentがハルシネーションに基づいて誤った操作を実行し、資金損失リスクがあります。防御が強すぎる：Agentはデータが不確実なすべての状況で実行を拒否し、最終的に「何もしないAgent」になります。

正しいバランスを見つける原則：

防御の強度を操作の不可逆性に比例させる：読み取り操作には厳格なハルシネーション防御は不要——数値を誤って読んでもオンチェーンの結果はありません。書き込み操作（トランザクションのブロードキャスト）には最も厳格な防御が必要です。

数値偏差閾値の動的設定：操作金額に基づいて動的に設定します：小額操作（$100未満）は10%の偏差を許容；大額操作（$5,000超）は2%の偏差のみ許容。

03 · 自分にどう影響する？

どのLLMでハルシネーション問題が最も深刻ですか？どのLLMのハルシネーション率が最も低いですか？

DeFi Agentシナリオでは、異なるLLMにはハルシネーション傾向に著しい違いがありますが、これは一般的なHallucination Benchmarkだけでは評価できません——DeFi Agentのハルシネーションは主に「知識的ハルシネーション」ではなく「グラウンディングハルシネーション」（LLMがContextのツールデータを無視する）だからです。

実際のオンチェーンAgentのデプロイ経験から：Claude Opus 4のグラウンディングハルシネーション率が最も低く；Claude Sonnetは中程度；小型モデル（Claude Haiku・GPT-4o mini）のグラウンディングハルシネーション率は大型モデルより著しく高い。強力なグラウンディングルールとバックエンドの数値整合性検証を組み合わせれば、Claude SonnetでもDeFi Agentシナリオで十分に低いハルシネーション率を達成できます。

04 · どうすればいい？

Agentのハルシネーションがすでに誤ったオンチェーン操作を引き起こした場合、事後的にどのように対処すべきですか？

ハルシネーションがすでに不可逆なオンチェーン操作の損失を引き起こした場合、事後の処置には3つのレベルがあります：

即時措置（発見から1時間以内）：Agentのすべての後続操作を停止；AgentのすべてのプロトコルへのERC-20無限承認を取り消す；現在の保有状況を評価します。

根本原因分析（24〜48時間）：完全なログを取得し（Thoughtログ・ツール呼び出しログ・検証ログ）、ハルシネーションの完全な因果チェーンを再構築します：どのThoughtステップが存在しない数値を引用し始めたか？バックエンド検証層はトリガーされたか？

防御の強化（根本原因分析完了後）：根本原因分析の結果に基づいて、防御を的を絞って強化します。強化後、まずテストネットで48〜72時間実行して問題が再発しないことを確認してから、メインネットのAgentを再起動します。

全文 +

通常のAI対話でのハルシネーション（幻覚）の結果は通常「間違った答えを提供した」というものです——もう一度聞くか自分で調べれば間違いを発見できます。DeFi Agentのシナリオでは、ハルシネーションの結果は全く異なります：Agentが「想像した」APYの数値に基づいてリバランスを決定し、そのリバランスは実際のオンチェーントランザクションであり、一度ブロードキャストされると取り消せません。Agentのハルシネーション + オンチェーンの不可逆性 = 実際の資金損失リスクです。

この記事は「LLMにはハルシネーションがあるからAgentで資金を管理できない」と言うのではなく——DeFi Agentのハルシネーションの4つの発生源・各発生源の典型的な表れ方・有効なエンジニアリング防御方法を体系的に分析します。

Agentのハルシネーション問題とは何か

LLMのハルシネーションとは、モデルが「もっともらしく見えるが実際には正しくない」内容を生成することを指します。LLMはデータベースのように「クエリして結果を返す」のではなく、訓練データの統計的パターンに基づいてテキストを生成します。不確実な情報に遭遇したとき、「わかりません」と言う代わりに、「もっともらしく聞こえる」答えを生成する傾向があります——これが間違っている可能性があります。

DeFi Agentシナリオでは3つの特別な増幅要因があります：第一にAgentのアウトプットがオンチェーンOperationを直接トリガーする。第二にDeFiデータは高度に動的で、感知層が現在のデータを提供せず訓練記憶に頼ると、ハルシネーションはほぼ必然的です。第三にハルシネーションはAgentの推論チェーンで増幅される——ステップ1のハルシネーション（誤ったAPY）がステップ2の入力となり（誤ったAPYに基づくリバランス決定）、ステップ2の誤った決定がステップ3のオンチェーン操作をトリガーします。

DeFiでのハルシネーションが通常の会話より危険な理由

具体的な比較で危険度の違いを説明します：通常の会話でのハルシネーション——ユーザーが「イーサリアムはいつ設立されましたか？」と聞き、LLMが「2013年」と答える（やや不正確——白書は2013年だが、メインネットは2015年）。結果：財務損失なし。

DeFi Agentのハルシネーション——AgentのThoughtステップが「現在のデータによると、CompoundのUSDC APYは8.5%でAaveの4.2%より高い；リバランスを実行すべき」と述べます。しかしツールログは`get_compound_apy`が`apy: 3.8`を返したことを示しています——Agentはツールの返却を無視し、「記憶」の中の古い数値を使用しました。結果：実際にはAPYが低いプロトコルへのリバランスを実行し、Gas費が長期間の収益差を相殺します。このハルシネーションの直接コスト：Gas費$5-20 + 数週間の収益損失。

ハルシネーションの4つの発生源

発生源1：感知層のデータ欠如——LLMが訓練記憶で空白を埋める：最も一般的なハルシネーションの発生源。ツール呼び出しが失敗したとき、LLMは訓練データからの歴史的印象に基づく数値をThoughtステップで引用します。防御：ツール呼び出しが失敗したとき、LLMに「推論を続けさせる」のではなく、即座に今回のサイクルを中止し次回のリトライを待ちます。

発生源2：Context中間の情報が無視される（針穴の中の針問題）：ContextWindowが長いとき、LLMはContextの中間の情報への注意力が最も弱くなります。防御：「最も重要な現在のデータ」をContextの末尾に置き（中間ではなく）、`<current_data>`タグに配置します。

発生源3：ツール返却データのフォーマットが非友好的——LLMの解析エラー：ツールが複雑なネストされたJSONを返すと、LLMは値の帰属を間違える可能性があります。防御：ツール関数でデータをフォーマットし、LLMが必要とする最小限のフィールドのみを渡します。

発生源4：Prompt Injectionによる偽データの注入：攻撃者がツール返却データに偽の数値情報を埋め込み、LLMに特定プロトコルのAPYが高いと信じさせます。防御：ツール返却データがContextに入る前に数値の合理性を検証し、異常値はContextに入れません。

ハルシネーション防御設計

防御1：ツールグラウンディング（Grounding）の強制：System Promptに「グラウンディングルール」を追加します：具体的な数値を含むすべての推論はツールが返したデータを引用し、データソースを明確に述べなければなりません；必要なデータのツール呼び出しが失敗した場合は実行を中止します。

防御2：バックエンドの数値整合性検証：LLMの各出力後・ツール実行前に「ThoughtとツールReturn数値の整合性検証」を行います：Thoughtで引用されたすべての数値を解析し、ツールログの実際の返却と比較；差異が5%を超える数値があればアラートを発し、ツール呼び出しの実行を拒否します。

防御3：重要データの複数ソースクロス検証：高影響の意思決定データについては、少なくとも2つの独立したデータソースから取得し、中央値または平均値を取ります；いずれかのソースが中央値から15%以上外れている場合はアラートを発し操作を停止します。

防御4：ツール返却値の合理性フィルタリング：ツール関数で返却値を合理的な範囲で検証します；範囲外の値はLLM Contextに入りません。ステーブルコインAPY：0〜30%（30%超はほぼ確実に異常）；Gasコスト：0.1〜1000 Gwei。

これはあなたの資金にどう関係するか

DeFi Agentのハルシネーション防御は「LLMをより賢くすること」ではありません——LLM自体のハルシネーション傾向は技術的制限であり完全には排除できません。有効なハルシネーション防御とは「LLMのハルシネーションに対して十分な耐障害性を持つシステムを設計すること」です：たとえLLMがある推論サイクルでハルシネーションを生成しても、バックエンド検証層がそれを識別して遮断し、ハルシネーションによる推論が実際のオンチェーン操作をトリガーするのを防ぎます。

最も重要な実践：LLMに「オンチェーン操作を実行する」ツールを直接持たせないこと——LLMのツール呼び出し出力をまずバックエンドコード層の検証（数値整合性・ホワイトリスト・金額上限）に通してからオンチェーン操作を実行します。このバックエンド検証層はDeFi Agentの最も重要なハルシネーション防護壁です。

図解

スクリーンショット歓迎。転載時は出典を明記してください。

質問する

参考リンク

オンチェーンデータ / TVL → オンチェーン分析ダッシュボード → ブロックエクスプローラー → 価格 / 市場データ → MCPサーバー一覧 → LLMベンチマーク → モデル比較 →