从0到1构建一个ClaudeAgent】工具与执行-Agent循环

张开发

• 2026/4/11 8:50:35 • 15 分钟阅读

分享文章

while True: response client.messages.create(messagesmessages, toolstools) if response.stop_reason ! tool_use: break for tool_call in response.content: result execute_tool(tool_call.name, tool_call.input) messages.append(result)这段代码人工翻译一下就是调模型给指令执行工具读写文件、跑命令回传结果告诉模型干了啥继续迭代直到任务干完就这就这。剩下的全是围绕这个循环的各种优化和补丁。用 Java 来写核心循环大概是这样while (true) { MessageResponse response client.messagesCreate(messages, tools); if (!tool_use.equals(response.getStopReason())) { break; } for (ToolCall toolCall : response.getContent()) { ToolResult result executeTool(toolCall.getName(), toolCall.getInput()); messages.add(result); } }正是考虑到我们的读者多数是Java同学因此我决定用Java来和大家一块学习下渐进式学习路径网站将这 12 个阶段s01-s12归纳为五个核心能力的进阶看看一个成熟的 Agent 系统是如何一步步被做出来的S01 Agent 循环最小可用的 Agent 内核仅仅需要一个 while 循环一个工具。说白了就是Agent 最本质的“大脑-手脚”循环Java实现代码public class AgentLoop { // 模拟 Anthropic API 客户端 private static final String API_KEY System.getenv(ANTHROPIC_API_KEY); private static final String MODEL_ID System.getenv(MODEL_ID); private static final HttpClient client HttpClient.newHttpClient(); // 核心循环 public static void agentLoop(ListMapString, Object messages) { while (true) { // 1. 调用 LLM System.out.println( 正在思考...); MapString, Object response callLLM(messages); // 2. 将助手回复加入历史 messages.add(response); // 3. 检查停止原因 // 注意这里简化了逻辑实际需解析 JSON 中的 stop_reason String stopReason (String) response.get(stop_reason); if (!tool_use.equals(stopReason)) { return; // 任务完成退出循环 } // 4. 执行工具 ListMapString, Object toolResults new ArrayList(); ListMapString, Object content (ListMapString, Object) response.get(content); for (MapString, Object block : content) { if (tool_use.equals(block.get(type))) { MapString, Object input (MapString, Object) block.get(input); String command (String) input.get(command); String toolId (String) block.get(id); System.out.println(\033[33m$ command \033[0m); // 黄色输出命令 // 执行 Bash String output runBash(command); System.out.println(output.length() 200 ? output.substring(0, 200) ... : output); // 构造工具结果 MapString, Object result new HashMap(); result.put(type, tool_result); result.put(tool_use_id, toolId); result.put(content, output); toolResults.add(result); } } // 5. 将工具结果作为用户输入再次加入历史 MapString, Object userTurn new HashMap(); userTurn.put(role, user); userTurn.put(content, toolResults); messages.add(userTurn); } } // 模拟 LLM 调用 (实际需替换为 SDK 调用) private static MapString, Object callLLM(ListMapString, Object messages) { // 这里是一个占位符实际应发送 HTTP 请求给 Anthropic API // 返回结构需匹配 API 响应 return new HashMap(); } // 执行 Shell 命令 private static String runBash(String command) { // 安全检查 if (command.contains(rm -rf /) || command.contains(sudo)) { return Error: Dangerous command blocked; } try { ProcessBuilder pb new ProcessBuilder(bash, -c, command); pb.redirectErrorStream(true); Process p pb.start(); // 读取输出 BufferedReader reader new BufferedReader(new InputStreamReader(p.getInputStream())); StringBuilder output new StringBuilder(); String line; while ((line reader.readLine()) ! null) { output.append(line).append(\n); } // 等待完成 (带超时) if (!p.waitFor(120, TimeUnit.SECONDS)) { p.destroyForcibly(); return Error: Timeout (120s); } String result output.toString().trim(); return result.isEmpty() ? (no output) : result.substring(0, Math.min(result.length(), 50000)); } catch (IOException | InterruptedException e) { return Error: e.getMessage(); } } public static void main(String[] args) { ListMapString, Object history new ArrayList(); Scanner scanner new Scanner(System.in); System.out.println(Agent 已启动 (输入 q 退出)); while (true) { System.out.print(\033[36ms01 \033[0m); String query scanner.nextLine(); if (query.trim().equalsIgnoreCase(q) || query.isEmpty()) { break; } MapString, Object userMsg new HashMap(); userMsg.put(role, user); userMsg.put(content, query); history.add(userMsg); agentLoop(history); // 打印最终回复 System.out.println(Agent 执行完毕。); } } }这段代码包含了所有 AI Agent 的灵魂。核心模式ReAct 循环代码中的while循环是 Agent 的心脏。它的逻辑是思考问 LLM 该做什么行动如果 LLM 说要调工具比如写代码、运行命令代码就去执行这个工具观察把工具执行的结果输出、报错再次告诉 LLM。循环LLM 根据结果决定是继续干还是说“搞定了”。while (true) { // 1. 调用 LLM MapString, Object response callLLM(messages); messages.add(response); // 2. 检查是否结束 String stopReason (String) response.get(stop_reason); if (!tool_use.equals(stopReason)) { return; // 任务完成 } // 3. 执行工具 ListMapString, Object toolResults executeTools(response); // 4. 将结果返回给 LLM messages.add(createUserTurn(toolResults)); }状态管理messages列表。它不仅仅是聊天记录它是 Agent 的短期记忆。每次循环我们都要把新的对话无论是人的指令还是工具的执行结果append进去。如果不把工具结果放回去LLM 就不知道自己刚才执行的命令成功了没有也就无法进行下一步。工具定义的标准化在代码的TOOLS变量里我们会定义了工具长什么样名字、参数。// 遍历响应中的工具调用块 for (MapString, Object block : content) { if (tool_use.equals(block.get(type))) { // 提取命令 MapString, Object input (MapString, Object) block.get(input); String command (String) input.get(command); String toolId (String) block.get(id); // 执行 Bash String output runBash(command); // 构建工具结果 MapString, Object result new HashMap(); result.put(type, tool_result); result.put(tool_use_id, toolId); result.put(content, output); toolResults.add(result); } }关键点LLM 不会真的“运行”代码它只是输出一个符合这个格式的 JSON比如{name: bash, arguments: {command: ls}}。而代码才是负责解析这个 JSON 并真的去执行Runtime.exec()。安全围栏代码里的run_bash函数不仅仅是执行命令它还充当了防火墙。private static String runBash(String command) { // 安全检查 if (command.contains(rm -rf /) || command.contains(sudo)) { return Error: Dangerous command blocked; } // 带超时的命令执行 if (!p.waitFor(120, TimeUnit.SECONDS)) { p.destroyForcibly(); return Error: Timeout (120s); } // 限制输出长度 return result.substring(0, Math.min(result.length(), 50000)); }重要永远不要让 LLM 直接拥有无限制的 Shell 权限。虽然这里的检查很简单黑名单但在生产环境中可能会需要沙箱环境Docker来运行这些命令。文章转载自Seven原文链接https://www.cnblogs.com/sevencoding/p/19821012体验地址http://www.jnpfsoft.com/?from410

从0到1构建一个ClaudeAgent】工具与执行-Agent循环

最新文章

PPIO上线GLM-5.1：面向8小时级长程任务的开源SOTA模型

Mirage Flow模型微调全流程：使用自定义数据提升领域任务性能

预训练模型中的位置编码：绝对位置、相对位置与旋转位置编码

用Python模拟10000次三门问题，结果让我彻底信服了贝叶斯公式

Ubuntu远程桌面实战：从VNC配置到安全连接全解析

Hyperf方案飞书消息卡片交互 - 发送可交互的消息卡片（按钮/下拉框），用户点击后回调到 Hyperf 服务处理业务

推荐文章

LeetCode 700. Search in a Binary Search Tree 题解

Design Tokens：设计系统的 DNA

老旧设备重生：OpenCore Legacy Patcher系统焕新全指南

得意黑Smiley Sans字体高效部署实战指南

毕设日志26.4.4（2）:ds3231画板细节，中断引脚接法，去耦电容

LeetCode 92. Reverse Linked List II 题解

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

3分钟快速上手：Switch注入工具TegraRcmGUI完整教程

用Arduino和WS2812灯带打造动态彩虹效果：100灯珠完整配置指南

第 2 课：EAP 岗位到底做什么

拉曼激光雷达：大气垂直廓线探测的高精度 “大气探针”

Qwen3.5-9B-AWQ-4bit赋能MySQL智能运维：SQL优化与故障诊断

机器人手眼标定避坑指南：C#九点标定中矩阵计算的那些‘坑’与最佳实践

Sunshine游戏流媒体服务器实战排错指南：从编码故障到系统优化的深度解析

R 4.5机器学习服务化实战（Shiny+plumber+Docker三重加固）：从本地训练到K8s集群一键部署

UDOP-large实战演示：从部署到批量处理英文文档全记录

公司禁用U盘、禁用移动硬盘、禁止聊天软件邮件附件网盘上传外发文件的方法

Qwen3.5-9B Anaconda环境管理专家：解决依赖冲突与镜像加速

RT-Thread实战指南：Cortex-M3/M4死机日志分析与精准定位

从0到1构建一个ClaudeAgent】工具与执行-Agent循环

最新文章

PPIO上线GLM-5.1：面向8小时级长程任务的开源SOTA模型

Mirage Flow模型微调全流程：使用自定义数据提升领域任务性能

预训练模型中的位置编码：绝对位置、相对位置与旋转位置编码

用Python模拟10000次三门问题，结果让我彻底信服了贝叶斯公式

Ubuntu远程桌面实战：从VNC配置到安全连接全解析

Hyperf方案 飞书消息卡片交互 - 发送可交互的消息卡片（按钮/下拉框），用户点击后回调到 Hyperf 服务处理业务

推荐文章

LeetCode 700. Search in a Binary Search Tree 题解

Design Tokens：设计系统的 DNA

老旧设备重生：OpenCore Legacy Patcher系统焕新全指南

得意黑Smiley Sans字体高效部署实战指南

毕设日志26.4.4（2）:ds3231画板细节，中断引脚接法，去耦电容

LeetCode 92. Reverse Linked List II 题解

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

Hyperf方案飞书消息卡片交互 - 发送可交互的消息卡片（按钮/下拉框），用户点击后回调到 Hyperf 服务处理业务

DotNetPy：现代.NET 与 Python 互操作实战指南