fundamentals

AIエージェントはどう考えるか：ReAct推論フレームワークの完全解説と、エージェントが本当に仕事をこなせるかどうかを左右する理由

30秒バージョン · 忙しい方へ

ReActフレームワークにより、AIエージェントは幻覚に基づく意思決定から脱却します——すべてのThought、Action、Observationには記録が残ります。この3ステップを読む能力が、エージェントが本当に推論しているか、論理的に見える間違いを犯しているかを見極める力になります。

Alex Mercer · 2026年06月15日

詳しく読む +

01 · なぜ起きたのか？

ReActフレームワークは2022年に提案されましたが、それ以前AIエージェントはどのように動作していましたか？なぜReActは突破口でしたか？

ReAct以前、AIエージェントの設計はおおよそ2つの派閥に分かれていました。第一は「純粋な推論型」：言語モデルを使ってすべての推論を行いますが、テキストしか出力できず、「ETHを買うべき」と言えても実際に注文を出せませんでした。第二は「純粋なツール型」：ルールやスクリプトで駆動され、事前設定のロジックに従ってツールを呼び出して操作を実行しますが、なぜそうするかを「考える」こともなく、ツールが失敗したり状況が変わっても柔軟に調整できませんでした。

ReActの突破口は「言語モデルの推論能力」と「ツール実行能力」を同じループに統合したことです。Thoughtステップによりモデルは「なぜ何かをするのか、次に何をすべきか」を最初に考え；ActionステップでAgentが実際に実行し；Observationステップが実行結果をモデルにフィードバックし、幻覚で未知を埋めるのではなく実際のデータで推論を続けます。

この設計によりエージェントは初めて「実際の世界のフィードバックに基づいて動的に調整する」能力を持ち、スクリプトを盲目的に最後まで実行するのではなくなりました。クリプトシナリオでは、市場状況が突然変化した時（例えばチェーン上で大規模な清算が発生した時）にエージェントが計画全体を再評価でき、すでに不適切になった事前設定の操作を継続しません。

02 · 仕組みは？

ReActループを1回実行するごとにお金がかかります（トークン費用）。実際のクリプトエージェントのデプロイメントでどのようにコストを制御しますか？

これはドキュメントではよく見落とされますが、実際のデプロイメントでは非常に重要な問題です。ReActの各ThoughtステップはLLMの呼び出しを必要とし、モデルとトークン使用量に基づいて課金されます。複雑なクリプトタスク（例：「5つの指標を確認してリバランスすべきかを評価する」）は10回のループを実行し、各ラウンドで2,000〜3,000トークン使用するかもしれません。GPT-4グレードのモデルを使用すると、1回のタスク実行に$0.30〜$0.80かかる可能性があります。小さく聞こえますが、エージェントが毎分タスクを実行したり、不適切に設計されたタスクが無限ループを引き起こした場合、月次コストは数百から数千ドルに跳ね上がる可能性があります。

コストを制御する3つの主流方法：第一に、最大ループ回数を設定する（通常5〜15回）——超えたら強制的にタスクを終了して「情報不足、人的介入が必要」と報告します。第二に、階層型モデル使用——Thoughtステップにはより安価なモデル（Claude HaikuやGPT-4o-miniなど）を使い、高品質の推論が必要な最終決定にのみ高価なモデルを使います。第三に、一般的なツール結果をキャッシュ——ETH価格が30秒以内にすでに照会されている場合、ObservationはAPIを再呼び出しせずキャッシュ結果を使います。

クリプトエージェントのコスト制御はシステム設計の重要な部分であり、稼働後に考えることではありません。

03 · 自分にどう影響する？

エージェントのThoughtステップが悪意あるツール（MCPサーバー攻撃）によって汚染された場合、どうやって操作されていると気づけますか？

これはクリプトAIエージェントで最も注意が必要なセキュリティ脅威の一つです。悪意あるMCPサーバー攻撃の原理：ツールの返答データのObservation結果に偽の情報を注入し、エージェントのThoughtステップが間違った「事実」の上で推論を続け、最終的に攻撃者が望む決定につながります。例えば：オンチェーン価格を照会するツールが侵害後に「ETH現在価格$500」（実際：$3,400）を返します。エージェントのThoughtステップがこれを読み込み「これは歴史的な底値、強い買いシグナル」と計算し、大規模な購入トランザクションに自律的に署名します。

エージェントが操作されているかもしれない兆候：意思決定の結果が実際の市場状況と著しく乖離している（例：明らかな下降トレンドでエージェントが継続的に買い注文を出す）；Observationステップのデータがあなた自身が確認できるものと一致しない；Thoughtステップがあなたが設定した目標と無関係な推論方向に向かっている。

防御方法：第一に、出所が確認可能で信頼できるMCPサーバーのみを承認する；第二に、重要なツール呼び出し（sign_tx）の前に独立したデータ検証ステップを強制追加する；第三に、異常な動作アラートを設定する——エージェントの操作が過去のパターンと大幅に乖離した場合、すぐに一時停止して通知します。

04 · どうすればいい？

主要なクリプトエージェントフレームワーク（ElizaOS、LangChain、AutoGen）のReAct実装の違いは何ですか？どうやって選びますか？

3つのフレームワークはすべてReActのコアループに基づいていますが、クリプトシナリオへの適用性は大きく異なります。

LangChain / LangGraph：最も成熟した汎用エージェントフレームワークで、ツールエコシステムが豊富で多くの既製DeFiデータコネクタ（Coingecko、The Graph、DEX API）があります。LangGraphのグラフベースのワークフロー設計により各ステップの論理分岐を精確に制御でき、複雑な条件判断を必要とする取引戦略に理想的です。欠点：フレームワーク自体が比較的重く、エンジニアリング背景のない人には不親切な急な学習曲線があります。最適：コーディング能力を持ち、高度にカスタマイズされたクリプト取引エージェントを必要とする開発者。

AutoGen：Microsoftが開発し、マルチエージェントコラボレーションが強みです。クリプトでの応用：1つのエージェントがテクニカル分析を担当し、別のエージェントがセンチメント分析を担当し、3番目がリスク評価を担当し、3者が議論してから最終決定を出力します。最適：複雑な多因子判断タスク、単一エージェントより冗長性と検証能力が高い。

ElizaOS：クリプトネイティブで、ai16zコミュニティが開発し、ソーシャルプラットフォーム（Twitter/Farcaster）とオンチェーンウォレットへのネイティブサポートが組み込まれています。ツールエコシステムはLangChainほど豊富ではありませんが、クリプト向けの統合はより深いです。最適：クリプトソーシャルエージェントのデプロイやai16zエコシステムとの統合が必要なシナリオ。

選択原則：コアニーズが取引戦略とオンチェーン操作なら、まずLangChainを見る；マルチエージェントによるクロス検証が必要なら、AutoGenを見る；クリプトコミュニティ＋ソーシャルエージェントなら、ElizaOSを見る。

全文 +

AIエージェントについて多くの人が最初に抱く疑問は「何ができるか」ですが、より重要な問いは「何をすべきかをどう決めるか」です。クリプトの取引エージェントが午前3時に市場の異変を検知し、「データを認識した」から「トランザクションに署名した」まで何が起きているのか？その答えはほぼ必ず同じフレームワークを指します——ReActです。

ReActは2022年にGoogleの研究チームが提案したフレームワークで、「Reasoning（推論）+ Acting（行動）」の略です。初期のAIシステムが持っていた核心的な欠陥——考えるだけで行動できない（純粋な推論モデル）か、考えずに行動するだけ（純粋なツール呼び出しスクリプト）——を解決しました。ReActはこの2つを「考える→行動する→観察する→また考える」というループに統合します。これが現在ほぼすべての主要なAIエージェントフレームワーク（LangChain、AutoGen、ElizaOS）の推論の核心です。

ReActループ：各ステップで何が起きているか

クリプトのシナリオで説明します。エージェントへのタスク：「今ETHは買う価値があるか？現在の価格と市場センチメントを確認してから判断して。」

エージェントはすぐに答えません。次のループを実行します：

ステップ1 Thought（思考）：「ETHの現在価格とセンチメント指標が必要だ。価格APIとセンチメント分析ツールの2つがある。まず価格を確認しよう。」——このステップは純粋なテキスト推論で、エージェントが次に何をなぜするかを自分自身に説明します。

ステップ2 Action（行動）：get_price(token='ETH')を呼び出します。エージェントが実際に何かを実行するステップ——APIを呼び出す、オンチェーンデータを読む、またはクリプト世界ではトランザクションに署名します。

ステップ3 Observation（観察）：ツールが結果を返します。「ETH現在価格$3,420、過去24時間で4.2%上昇」。エージェントはこれを読み込み、次の推論ラウンドのインプットにします。

Thoughtに戻る：「価格は少し高め、4%上昇している。センチメントもまだ確認が必要だ。センチメントツールを呼び出そう。」そしてAction→Observation→Thoughtを繰り返し……エージェントが十分な情報があると判断するまで続けます。

このループの重要な点：推論の各ステップが明示的で追跡可能であることです。エージェントがなぜその決定を下したか、どのステップで判断を誤ったか、どのツールが誤った結果を返したかを一行ずつ確認できます。クリプトにおいてこれは特に重要です——エージェントが損失を出すトランザクションを自律的に実行した場合、どのThoughtステップに問題があったかを特定する必要があるからです。

ReActと「ChatGPTに聞く」の違い

ChatGPTに「ETHは買う価値があるか」と聞くと、学習データに基づいたもっともらしい答えが返ってきます——しかしその「ETH価格」は数ヶ月前のものかもしれず、センチメント分析はリアルタイムデータではなくモデル自身の推測です。

ReActエージェントが違うのは、自分が知らないことを知っており、積極的に調べに行くことです。Thoughtステップによりエージェントはまず「どんな情報が必要で、どのツールで取得できるか」を計画し、Actionが実際に取得し、Observationが実際の結果を読み込んで、それから判断します。プロセス全体がリアルタイムデータに基づく推論であり、学習データの幻覚ではありません。

ReActが失敗するとき：どんな時に悪い判断をするか

ReActの限界を理解することは、その能力を理解することと同じくらい重要です——特にオンチェーン資産の管理をエージェントに任せる場合。

ツールがゴミを返し、エージェントがそれを信じる。ReActのObservationステップはツールの出力を信頼可能と仮定します。DEXの価格APIが低流動性時に異常な価格を返した場合、エージェントはそれをそのまま受け入れるかもしれません。悪意あるMCP Serverへの攻撃はまさにこれを利用します——ツールの応答に偽情報を注入し、Thoughtステップを汚染します。

ループ回数が多すぎてトークン予算を使い果たす。ReActの各ループはLLMの推論呼び出しを必要とし、トークンで課金されます。タスク設計が悪いと、エージェントが「もっと情報が必要」という無限ループに陥り、トークン予算が尽きるまで止まらない場合があります。

Thoughtの推論エラーが増幅される。エージェントが最初のThoughtステップで誤った仮定をした場合、その後のすべてのActionとObservationが誤った仮定の上に積み重なります。結果は論理的に見えながら完全に間違ったものになりえます。

クリプトエージェントにおけるReActの実装：実際のアーキテクチャ

クリプトネイティブなエージェントフレームワーク（ElizaOSやLangChainを例にとると）では、ReActは通常このように実装されます。まず、エージェントに呼び出せるすべてのツールを含むツールボックスを与えます（DEX価格照会、オンチェーンデータAPI、ウォレット残高照会、トランザクション署名関数）。各ツールには明確な説明があり、エージェントのThoughtステップはこれらの説明を読んでどれを呼び出すかを決定します。説明が曖昧なツールは誤ったツール選択を引き起こします。次に、最大ループ回数を設定します（例：10ラウンド）。無限ループを防ぐためです。第三に、ツール呼び出しの権限レイヤーを実装します：読み取り専用ツール（価格照会、オンチェーンデータ）は自由に呼び出せますが、書き込みツール（トランザクション署名、資金移動）は追加の確認ゲートまたはトランザクション金額上限が必要です。このアーキテクチャにより「エージェントが十分な情報を持って適切に判断できるようにすること」と「確認なしにエージェントが資金を動かせないようにすること」のバランスが取れます。

これはあなたのお金にどう関係するか

クリプトのAIエージェントを使用または展開する予定がある場合、ReActフレームワークを理解することには3つの直接的な影響があります。第一に、エージェントの意思決定ログが読めるようになります——ほぼすべてのReActベースのエージェントはThought/Action/Observationの記録を出力します。これを読む能力が、エージェントが本当に推論しているかどうかを判断する力になります。第二に、悪いトランザクションをどこで監査するかがわかります——エージェントが損失を出した場合、最初にすべきことはThoughtステップを見つけることです。仮定が間違っていたか？ツールが誤ったデータを返したか？推論チェーンの途中で何かが壊れたか？第三に、意味のあるツール権限の設定方法がわかります。Actionステップが何をできるかは、どのツールを与え、その限界をどこに設定したかに完全に依存します。それを理解することが、十分に賢く、かつ制御可能なシステムを構築する方法です。

図解

スクリーンショット歓迎。転載時は出典を明記してください。

質問する