6

第六章

エージェントを
作る

電卓と同僚の違い。

チャットボットは君が話すのを待つ。エージェントは待たない。目標を与える。「火星の植民地化を調べてレポートを書いて」。するとエージェントは作業をステップに分解し、適切なツールを選び、ひとつずつ実行し、結果を自分でチェックし、仕事が終わるまで走り続ける。指示に応答するのと目標を追求するのは別物だ。それが電卓と同僚の違いだ。

エージェントはループで動く。目標を受け取り、ステップを計画し、ツールで実行し、結果を観察し、進捗を評価し、調整する。一度計画して盲目的に実行するんじゃない。優れたエージェントはステップ3がうまくいかなくても優雅にリカバリーする。でもそのパワーには暗い面もある。エージェントは悪い答えを出すだけじゃなく、それに基づいて行動し、壊れた結果を使って次の判断を下す。失敗が雪だるま式に膨らむのだ。

エージェントループ

すべてのエージェントは同じ5ステップのサイクルで動く。このステップを理解することが、使えるものを作るか、APIクレジットを無限ループで溶かすかの分かれ目だ。

G

ゴール

明確な目的を受け取る。「火星を調べて」はゴールじゃない。「火星植民地化の課題を500語でまとめろ、ソース付きで」がゴールだ。

P

プラン

ゴールを具体的なステップに分解する。良い計画者は柔軟なプランを作る。悪い計画者は最初の想定外で崩壊する硬直的なスクリプトを作る。

T

実行

各ステップを適切なツールで実行する。検索エンジン、コードインタプリタ、ファイルリーダー、API。エージェントは考えるだけじゃない。行動する。

M

観察

何が起きたか記録し、結果を確認する。記憶がなければ、エージェントは同じ失敗を永遠に繰り返すかもしれない。

E

評価

うまくいったか? ゴールに近づいたか? 何かおかしければプランを修正してもう一度ループする。これがエージェントとスクリプトを分けるものだ。

重要なポイント

チャットボットは1ターン。エージェントは丸ごとの会話だ。自分自身と、ツールと、世界との。最高のエージェント設計者は自律性を最大化しない。エージェントが立ち止まり、人間に続行するかどうかを判断させる、思慮深いチェックポイントをデザインする。

さあ、作ってみよう。戦車エージェントを設計し、能力を選び、予算を割り当て、戦略を書いて、アリーナに投入して自律的に戦わせよう。

Agent Arena
Configure

Capabilities

5 pts left
Armor
2
Speed
2
Power
2
Rate
2
Range
2

Strategy (system prompt)

Close distance. Fire constantly. Prioritize damage over survival.

Opponent

Share this course
目標はすべての失敗を防ぐことじゃない。失敗をリカバリー可能にすることだ。

次は、本物のエージェントを使う。コードを読み、変更を書き、テストを実行し、自分のミスを修正するエージェント。Claude Codeの登場だ。

Agent Swarm

New tool unlocked!