6

6장

에이전트
만들기

계산기와
동료의 차이.

챗봇은 네가 말할 때까지 기다려. 에이전트는 안 그래. 목표를 줘 — "화성 식민지에 대해 조사하고 보고서 써줘" — 그러면 작업을 단계로 나누고, 적절한 도구를 고르고, 하나씩 실행하고, 결과를 스스로 확인하고, 일이 끝날 때까지 계속 가. 이 차이 — 지시에 반응하는 것목표를 추구하는 것 — 이 계산기와 동료의 차이야.

에이전트는 루프로 돌아가: 목표를 받고, 단계를 계획하고, 도구로 실행하고, 결과를 관찰하고, 진행 상황을 평가하고, 조정해. 한 번 계획하고 눈 감고 실행하는 게 아니야 — 최고의 에이전트는 세 번째 단계가 꼬여도 우아하게 복구해. 근데 그 힘에는 어두운 면이 있어: 에이전트는 나쁜 답을 주는 데서 그치지 않아, 그걸 기반으로 행동하고, 깨진 결과로 다음 결정을 내려. 실패가 쌓여.

에이전트 루프

모든 에이전트는 같은 다섯 단계 사이클로 돌아가. 이 단계들을 이해하는 게 유용한 걸 만드는 것과 API 크레딧을 무한 루프로 태우는 것의 차이야.

G

목표 (Goal)

명확한 목표를 받아. "화성 조사해"는 목표가 아니야. "화성 식민지의 도전과제에 대해 출처 포함 500단어 요약을 써줘"가 목표야.

P

계획 (Plan)

목표를 구체적인 단계로 나눠. 좋은 플래너는 유연한 계획을 만들어. 나쁜 플래너는 첫 번째 예상치 못한 상황에 부서지는 딱딱한 스크립트를 만들어.

T

실행 (Execute)

각 단계를 적절한 도구로 실행해 — 검색 엔진, 코드 인터프리터, 파일 리더, API. 에이전트는 생각만 하는 게 아니야. 행동해.

M

관찰 (Observe)

무슨 일이 있었는지 기록하고 결과를 확인해. 메모리 없이는 에이전트가 같은 실패하는 행동을 영원히 반복할 수 있어.

E

평가 (Evaluate)

이게 작동했어? 목표에 더 가까워졌어? 뭔가 잘못되면 계획을 조정하고 다시 루프. 이게 에이전트와 스크립트를 구분하는 거야.

핵심 포인트

챗봇은 한 턴이야. 에이전트는 전체 대화야 — 자기 자신, 도구, 그리고 세상과의 대화. 최고의 에이전트 빌더는 자율성을 최대화하지 않아. 에이전트가 멈추고 사람이 계속할지 결정하는 사려 깊은 체크포인트를 설계해.

만들어볼 시간이야. 탱크 에이전트를 설계해 — 능력을 선택하고, 예산을 배분하고, 전략을 짜 — 그리고 아레나에 배치해서 자율적으로 싸우는 걸 지켜봐.

Agent Arena
Configure

Capabilities

5 pts left
Armor
2
Speed
2
Power
2
Rate
2
Range
2

Strategy (system prompt)

Close distance. Fire constantly. Prioritize damage over survival.

Opponent

Share this course
목표는 모든 실패를 막는 게 아니야 — 실패를 복구 가능하게 만드는 거야.

다음: 진짜 에이전트를 써볼 거야 — 네 코드를 읽고, 수정하고, 테스트를 실행하고, 자기 실수를 고치는 에이전트. Claude Code를 만나봐.

Agent Swarm

New tool unlocked!