Chương sáu
Xây dựng
Agent
Sự khác biệt giữa máy tính bỏ túi
và đồng nghiệp.
Chatbot đợi bạn nói. Agent thì không. Đưa cho nó mục tiêu — "nghiên cứu về định cư sao Hỏa và viết báo cáo" — và nó chia công việc thành các bước, chọn đúng công cụ, thực hiện từng bước, kiểm tra kết quả, rồi tiếp tục cho đến khi xong. Sự khác biệt đó — giữa phản hồi chỉ thị và theo đuổi mục tiêu — là sự khác biệt giữa máy tính bỏ túi và đồng nghiệp.
Agent chạy trên một vòng lặp: nhận mục tiêu, lên kế hoạch, thực hiện bằng công cụ, quan sát kết quả, đánh giá tiến độ, điều chỉnh. Chúng không lên kế hoạch một lần rồi chạy mù — agent tốt nhất phục hồi mượt mà khi bước ba gặp sự cố. Nhưng sức mạnh đó có mặt trái: agent không chỉ đưa ra câu trả lời tệ, chúng hành động dựa trên đó, rồi dùng kết quả hỏng để ra quyết định tiếp. Lỗi chồng lỗi.
Vòng lặp Agent
Mọi agent đều chạy trên cùng một chu kỳ năm bước. Hiểu các bước này là sự khác biệt giữa xây thứ hữu ích và xây thứ đốt hết credit API trong vòng lặp vô hạn.
Mục tiêu (Goal)
Nhận mục tiêu rõ ràng. "Nghiên cứu sao Hỏa" không phải mục tiêu. "Viết tóm tắt 500 từ về thách thức định cư sao Hỏa, có nguồn" mới là.
Lập kế hoạch (Plan)
Chia mục tiêu thành các bước cụ thể. Planner giỏi tạo kế hoạch linh hoạt. Planner tệ tạo script cứng nhắc, vỡ ngay khi gặp bất ngờ.
Thực hiện (Execute)
Chạy mỗi bước bằng công cụ phù hợp — công cụ tìm kiếm, trình thông dịch code, trình đọc file, API. Agent không chỉ nghĩ. Chúng hành động.
Quan sát (Observe)
Ghi nhận kết quả và kiểm tra. Không có bộ nhớ, agent có thể lặp đi lặp lại cùng hành động thất bại mãi mãi.
Đánh giá (Evaluate)
Cái này có hoạt động không? Mình đã gần mục tiêu hơn chưa? Nếu có vấn đề, điều chỉnh kế hoạch và lặp lại. Đây là thứ phân biệt agent với script.
Điểm mấu chốt
Chatbot là một lượt. Agent là cả cuộc trò chuyện — với chính nó, công cụ của nó, và thế giới. Người xây agent giỏi nhất không tối đa hóa tự chủ. Họ thiết kế những điểm dừng có suy nghĩ, nơi agent tạm dừng và để con người quyết định có tiếp tục không.
Đến lúc xây một cái. Thiết kế agent xe tăng — chọn năng lực, phân bổ ngân sách, viết chiến lược — rồi triển khai vào đấu trường và xem nó chiến đấu tự động.
Tiếp theo: bạn sẽ dùng agent thật — agent đọc code, viết thay đổi, chạy test, và tự sửa lỗi. Xin giới thiệu Claude Code.