6

अध्याय सहा

Agents
बनवणं

Calculator आणि
coworker मधला फरक.

Chatbot तू बोलेपर्यंत वाट बघतो. Agent नाही. त्याला goal दे — "Mars colonization वर research कर आणि report लिही" — आणि तो काम steps मध्ये तोडतो, योग्य tools निवडतो, एक एक करून execute करतो, स्वतःचे results check करतो, आणि काम पूर्ण होईपर्यंत चालू ठेवतो. हा फरक — instructions ला respond करणं आणि goal pursue करणं — हा calculator आणि coworker मधला फरक आहे.

Agents एका loop वर चालतात: goal मिळवा, steps plan करा, tools ने execute करा, results observe करा, progress evaluate करा, adjust करा. ते एकदा plan करून blindly execute करत नाहीत — सर्वात चांगले agents तिसरा step चुकला तरी gracefully recover करतात. पण या power ची dark side आहे: agents फक्त चुकीची उत्तरं देत नाहीत, ते त्यांवर act करतात, आणि मग तो broken result पुढचा decision घेण्यासाठी वापरतात. चुका compound होतात.

Agent Loop

प्रत्येक agent एकाच पाच-step cycle वर चालतो. हे steps समजणं म्हणजे काहीतरी useful बनवणं आणि API credits infinite loop मध्ये जाळणं यातला फरक आहे.

G

Goal (ध्येय)

स्पष्ट objective मिळव. "Mars वर research कर" हे goal नाही. "Mars colonization challenges चं 500-शब्दी summary लिही, sources सह" हे goal आहे.

P

Plan (योजना)

Goal ला concrete steps मध्ये तोड. चांगले planners flexible plans बनवतात. वाईट planners rigid scripts बनवतात जे पहिल्या surprise ला तुटतात.

T

Execute (अमलबजावणी)

प्रत्येक step योग्य tool वापरून run कर — search engines, code interpreters, file readers, APIs. Agents फक्त विचार करत नाहीत. ते act करतात.

M

Observe (निरीक्षण)

काय झालं ते record कर आणि results check कर. Memory शिवाय, agent तीच failing action कायमची repeat करू शकतो.

E

Evaluate (मूल्यांकन)

हे काम झालं का? मी goal च्या जवळ आलो का? काही चुकलं तर plan adjust कर आणि परत loop कर. हेच agent ला script पेक्षा वेगळं करतं.

मुख्य मुद्दा

Chatbot एक single turn आहे. Agent एक संपूर्ण conversation आहे — स्वतःशी, त्याच्या tools शी, आणि जगाशी. सर्वात चांगले agent builders autonomy maximize करत नाहीत. ते विचारपूर्वक checkpoints design करतात जिथे agent थांबतो आणि माणसाला पुढे जायचं का ते ठरवू देतो.

आता एक बनव. Tank agent design कर — त्याच्या capabilities निवड, budget allocate कर, आणि strategy लिही — मग arena मध्ये deploy कर आणि तो autonomously लढताना बघ.

Agent Arena
Configure

Capabilities

5 pts left
Armor
2
Speed
2
Power
2
Rate
2
Range
2

Strategy (system prompt)

Close distance. Fire constantly. Prioritize damage over survival.

Opponent

Share this course
ध्येय सगळ्या failures रोखणं नाही — failure recoverable बनवणं आहे.

पुढे: तू एक खरा agent वापरशील — जो तुझा code वाचतो, changes लिहितो, tests run करतो, आणि स्वतःच्या चुका दुरुस्त करतो. Claude Code ला भेट.

Agent Swarm

New tool unlocked!