AI Agent新手入门：从零开始学习大模型，收藏这份学习指南

张开发

• 2026/4/21 15:46:28 • 15 分钟阅读

分享文章

本文系统性介绍了AI Agent的概念、与LLM的区别并通过Python代码实例展示了如何实现一个最小的ReAct Agent。文章还深入解析了smolagents框架的内部机制包括System Prompt、Agent执行日志、记忆机制等并对比了CodeAgent和ToolCallingAgent两种执行范式。此外还探讨了多Agent协作、Agent调控方法以及生产环境注意事项为读者提供了全面的学习指南。1、 AI Agent 到底是什么1.1 LLM 和 Agent 的核心区别你用过 ChatGPT 或者 DeepSeek 对话它们能写文章、翻译、写代码。但你让它帮我查一下今天北京的天气然后订一家评分最高的餐厅——它做不到。为什么因为 LLM 本质上只做一件事输入文本输出文本。它没有手不能上网查天气不能调用订餐 API甚至不知道现在是几点。Agent 解决的就是这个问题。一句话概括LLM 是一个只能说话的大脑Agent 是一个能思考、能动手、能从结果中学习的完整系统。LLMAgent能力生成文本生成文本调用工具观察结果状态无状态每次对话独立有记忆记住之前做了什么决策一次性回答多步推理自主决定下一步边界训练数据截止日期内的知识可以访问实时数据和外部系统1.2 Agent 的四大支柱一个完整的 Agent 系统由四个核心组件构成┌─────────────┐ │ 用户任务 │ └──────┬──────┘ ▼ ┌────────────────────────┐ │ LLM │ │ 大脑 / 推理引擎 │ └────────────────────────┘ ▲ ▲ ▲ ▲ │ │ │ │ ┌─────┘ ┌──┘ ┌──┘ ┌──┘ ▼ ▼ ▼ ▼ ┌────────┐┌──────┐┌─────┐┌──────────┐ │ 规划 ││ 记忆 ││ 工具 ││ 行动循环 │ │Planning││Memory││Tools││Action Loop│ └────────┘└──────┘└─────┘└──────────┘规划Planning把复杂任务拆解成可执行的步骤记忆Memory记住之前的对话和操作结果工具Tools扩展 LLM 的能力边界——计算器、搜索引擎、API 调用行动循环Action Loop把上面三者串起来的执行引擎也就是 ReAct 循环1.3 为什么现在 Agent 变得实用了Agent 的概念并不新但直到最近才真正可用原因有三LLM 能力跃升GPT-4、Claude、DeepSeek 等模型的推理能力足够强能可靠地遵循复杂指令和工具调用格式工具调用标准化OpenAI 的 Function Calling、Anthropic 的 Tool Use、以及 MCP 让工具集成有了统一接口框架生态成熟LangChain、LangGraph、smolagents、CrewAI 等框架大幅降低了构建 Agent 的门槛理论讲够了我们来写代码。2、手写一个最小 ReAct Agent2.1 ReAct 是什么ReAct 来自 2022 年 Yao et al. 的论文“ReAct: Synergizing Reasoning and Acting in Language Models”。核心思想极其简单让 LLM 交替进行思考和行动每次行动后观察结果再决定下一步。┌──────────────────────────────────────────────────┐ │ 用户任务 │ └──────────────────────┬───────────────────────────┘ ▼ ┌─────────────┐ ┌───▶│ Thought │ LLM 思考我需要做什么 │ └──────┬──────┘ │ ▼ │ ┌─────────────┐ │ │ Action │ LLM 决定调用哪个工具 │ └──────┬──────┘ │ ▼ │ ┌─────────────┐ │ │ Observation │ 执行工具拿到结果 │ └──────┬──────┘ │ ▼ │ 还需要更多 ──── 是 ────┐ │ 步骤吗 │ │ │ │ │ 否 │ │ ▼ │ │ ┌─────────────┐ │ │ │ Final Answer│ │ │ └─────────────┘ │ └─────────────────────────────────┘为什么这比让 LLM 一次性回答更好因为每一步都有真实的观察结果来校准推理。LLM 不是在凭空想象答案而是基于实际数据一步步推导。2.2 纯 Python 实现 ReAct 循环下面这段代码不依赖任何 Agent 框架只用 Python LLM API实现一个完整的 ReAct Agent。注意calculator中的eval()仅用于学习演示生产环境必须使用沙箱 minimal_react.py — 纯手写 ReAct Agent不依赖任何框架 import json, re from litellm import completion # ── 第一步定义工具 ────────────────────────────────── def calculator(expr: str)- str: 安全受限的计算器生产环境应使用 AST 解析或沙箱 import ast, operator allowed {ast.Add: operator.add, ast.Sub: operator.sub, ast.Mult: operator.mul, ast.Div: operator.truediv, ast.Pow: operator.pow} tree ast.parse(expr, modeeval) def _eval(node): if isinstance(node, ast.Expression):return _eval(node.body) if isinstance(node, ast.Constant):return node.value if isinstance(node, ast.BinOp):return allowed[type(node.op)](_eval(node.left), _eval(node.right)) raiseValueError(f不支持的操作: {ast.dump(node)}) return str(_eval(tree)) def weather(city: str)- str: return{北京:晴 22°C,上海:多云 26°C}.get(city,未知城市) tools {calculator: calculator,weather: weather} tool_desc \n.join(f- {name}: 调用方式 {name}(参数)for name in tools) # ── 第二步设计 System Prompt ───────────────────────── SYSTEM_PROMPT f你是一个 ReAct Agent。收到任务后按以下格式交替输出 Thought: 你的思考过程 Action: 工具名(参数) 等待系统返回 Observation 后继续思考。当你得出最终答案时输出 Thought: 我已经得到了答案。 Final Answer: 最终答案可用工具 {tool_desc} # ── 第三步ReAct 循环 ───────────────────────────────── def react_agent(task: str, max_steps: int 5)- str: messages [ {role:system,content: SYSTEM_PROMPT}, {role:user,content: task}, ] for step in range(max_steps): response completion(modeldeepseek/deepseek-chat, messagesmessages) output response.choices[0].message.content print(f\n── Step {step} ──\n{output}) ifFinal Answer:in output: return output.split(Final Answer:)[-1].strip() action_match re.search(rAction:\s*(\w)\((.?)\), output) if action_match: tool_name, arg action_match.group(1), action_match.group(2).strip(\) observation tools[tool_name](arg)if tool_name in tools else未知工具 print(fObservation: {observation}) messages.append({role:assistant,content: output}) messages.append({role:user,content: fObservation: {observation}}) else: messages.append({role:assistant,content: output}) return达到最大步数未得出答案 # ── 运行 ────────────────────────────────────────────── answer react_agent(北京今天天气怎么样如果气温超过 20 度计算 20 * 3.14 的值。) print(f\n最终答案: {answer})这段代码只有 ~50 行但它包含了一个 Agent 的全部核心要素要素对应代码工具注册tools字典System Prompt告诉 LLM 用 Thought/Action/Observation 格式ReAct 循环forstepinrange(max_steps)工具调用正则解析 Action执行对应函数记忆messages列表累积对话历史终止条件检测FinalAnswer:或达到 max_steps2.3 手写的局限性这个最小实现能跑但离生产可用差得远解析脆弱靠正则匹配Action:tool(arg)LLM 稍微变一下格式就挂了没有沙箱即使用了 AST 解析复杂场景下仍有安全隐患错误处理缺失工具调用失败、LLM 输出格式错误都没处理不支持复杂工具多参数、嵌套调用、异步工具都搞不定这就是为什么我们需要框架。接下来用 smolagents 看看同样的事情怎么做。3、用 smolagents 10 行代码跑起来上面我们手写了 50 行代码实现 ReAct。smolagents 把这些全部封装好了——模型适配、Prompt 模板、循环控制、工具解析、错误恢复——你只需要关心业务逻辑。from smolagents importCodeAgent,LiteLLMModel model LiteLLMModel(model_iddeepseek/deepseek-chat, temperature0.7) agent CodeAgent(tools[], modelmodel, add_base_toolsTrue) result agent.run(斐波那契数列的第 20 项是多少请同时告诉我计算过程。) print(result)三个核心要素和手写版一一对应手写版smolagentscompletion()调用 LLMLiteLLMModel封装模型调用tools字典正则解析CodeAgent自动管理工具forstepinrange(max_steps)Agent 内部的 ReAct 循环关键区别smolagents 的CodeAgent不是让 LLM 输出Action:tool(arg)这种文本格式而是让 LLM直接写 Python 代码。LLM 可以用循环、条件判断、变量赋值——表达力远超文本格式。add_base_toolsTrue会添加内置工具如PythonInterpreterTool让 Agent 即使没有自定义工具也能通过写代码来解决问题。4、深入 ReAct 内部机制框架帮我们封装了细节但理解内部机制才能在出问题时知道怎么调试。这一节我们拆开 smolagents 的 Agent看看每一层发生了什么。4.1 System Prompt — LLM 看到了什么Agent 的行为由 System Prompt 决定。smolagents 使用 Jinja2 模板在初始化时把工具描述、managed_agents 信息注入进去agent CodeAgent(tools[], modelmodel, add_base_toolsTrue) # 查看 System Prompt 模板 system_prompt agent.prompt_templates[system_prompt] print(fSystem prompt 长度: {len(system_prompt)} 字符) print(system_prompt[:500])这个 System Prompt 告诉 LLM你是一个 Agent要按 Thought → Code → Observation 的格式工作你可以使用这些工具自动列出每个工具的名称、描述、参数类型当你得出最终答案时调用final_answer()函数你还可以通过instructions参数追加自定义指令不需要修改模板custom_agent CodeAgent( tools[], modelmodel, add_base_toolsTrue, instructions你是一个数学教授。回答问题时请用通俗易懂的方式解释推理过程。, ) result custom_agent.run(为什么 0.1 0.2 不等于 0.3)4.2 Agent 执行日志 — 逐步拆解 ReAct 循环agent.logs记录了每一步的详细信息。我们用一个斐波那契工具来观察from smolagents import tool tool def fibonacci(n: int)- str: 计算斐波那契数列的第 n 项。 Args: n: 要计算的项数从第 1 项开始 if n 0: returnn 必须是正整数 a, b 0,1 for _ in range(n -1): a, b b, a b return f斐波那契数列第 {n} 项是 {b} log_agent CodeAgent(tools[fibonacci], modelmodel, max_steps5) result log_agent.run(斐波那契数列第 10 项和第 20 项分别是多少它们的比值接近什么数)运行后查看日志for i, step in enumerate(log_agent.logs): if hasattr(step,model_output): print(f\n--- Step {i} ---) print(fLLM 输出: {step.model_output[:200]}...) if hasattr(step,observations): print(f观察结果: {step.observations[:200]}...)你会看到类似这样的执行过程──Step0── LLM 输出:Thought:我需要分别计算第10项和第20项然后算比值... Code: result_10 fibonacci(10) result_20 fibonacci(20) print(result_10, result_20) 观察结果:斐波那契数列第10项是55斐波那契数列第20项是6765 ──Step1── LLM 输出:Thought:比值是6765/55≈123这接近黄金比例的幂... Code: ratio 6765/55 final_answer(f第10项55, 第20项6765, 比值≈{ratio:.2f})注意 CodeAgent 在一步内就调用了两次fibonacci用 Python 变量存储结果这是它比 ToolCallingAgent 高效的原因。4.3 Agent 的记忆 — writememoryto_messages()Agent 的记忆就是对话历史。每一步的 LLM 输出和工具观察结果都会被追加到消息列表中作为下一步的上下文messages log_agent.write_memory_to_messages() print(f总消息数: {len(messages)}) for msg in messages: print(f {str(msg.content)[:100]}...)这个方法做了两件事把 System Prompt 转成消息格式把每个执行步骤memory.steps转成消息追加进去这就是 Agent 能记住之前做了什么的原因——所有历史都在messages里每次调用 LLM 时一起发送。5、工具系统入门5.1 为什么需要工具LLM 有三个硬伤不知道实时信息、不能精确计算、不能操作外部系统。工具就是给 LLM 装上的手LLM 做不到的工具解决方案不知道现在几点时间查询工具算不准浮点数计算器工具不能查数据库数据库查询工具不能发邮件邮件 API 工具工具的本质是一个函数它有名称、描述、输入参数类型和返回值。LLM 通过阅读工具描述来决定什么时候用、怎么用。5.2 tool 装饰器 — 最简单的定义方式from smolagents import tool tool def get_current_time(timezone: str Asia/Shanghai)- str: 获取指定时区的当前时间。 Args: timezone: 时区名称如 Asia/Shanghai, US/Eastern, Europe/London from datetime import datetime import zoneinfo zone zoneinfo.ZoneInfo(timezone) now datetime.now(zone) return now.strftime(%Y-%m-%d %H:%M:%S %Z)三个关键点函数名就是工具名——LLM 在代码中直接调用get_current_time()docstring是 LLM 理解工具的唯一依据——写不清楚Agent 就不会正确使用类型注解告诉 LLM 参数类型——timezone:str让 LLM 知道要传字符串5.3 Tool 子类 — 复杂工具的定义方式当工具需要初始化状态比如数据库连接或有复杂的输入结构时用子类更合适from smolagents importTool classUnitConverter(Tool): name unit_converter description 单位换算工具支持长度、重量、温度的常见单位转换 inputs { value:{type:number,description:要转换的数值}, from_unit:{type:string,description:原始单位如 km, mile, kg, lb}, to_unit:{type:string,description:目标单位}, } output_type string conversions { (km,mile):lambda v: v *0.621371, (mile,km):lambda v: v *1.60934, (celsius,fahrenheit):lambda v: v *9/532, (fahrenheit,celsius):lambda v:(v -32)*5/9, } def forward(self, value: float, from_unit: str, to_unit: str)- str: key (from_unit.lower(), to_unit.lower()) if key in self.conversions: result self.conversions[key](value) return f{value} {from_unit} {result:.4f} {to_unit} return f不支持从 {from_unit} 到 {to_unit} 的转换两种方式的选择很简单简单无状态用tool复杂有状态用Tool子类。5.4 Agent 自主选择工具把多个工具交给 Agent它会根据任务自动选择合适的工具——你不需要告诉它用哪个tool def weather_lookup(city: str)- str: 查询城市的天气信息模拟数据。 Args: city: 城市名称如北京, 上海, 东京 mock_weather { 北京:{temp:22,condition:晴,humidity:35}, 上海:{temp:26,condition:多云,humidity:65}, 东京:{temp:20,condition:小雨,humidity:78}, } if city in mock_weather: w mock_weather[city] return f{city}: {w[condition]}, 温度 {w[temp]}°C, 湿度 {w[humidity]}% return f暂无 {city} 的天气数据 agent CodeAgent( tools[get_current_time, weather_lookup,UnitConverter()], modelmodel, ) # Agent 自动选择 weather_lookup 推理 agent.run(北京和东京今天哪个城市更适合户外活动请给出理由。) # Agent 自动选择 UnitConverter agent.run(100 公里换算成英里是多少)这就是 Agent 的自主决策能力——它读了每个工具的描述理解了任务需求然后自己决定调用哪些工具、以什么顺序调用。6、CodeAgent vs ToolCallingAgentsmolagents 提供两种 Agent代表两种截然不同的执行范式┌─────────────────┬──────────────────────────────────────┐ │CodeAgent│ LLM 生成Python代码直接执行│ ││支持循环、条件、变量→更灵活│ ││研究表明比 JSON 方式少30%步骤│ ├─────────────────┼──────────────────────────────────────┤ │ToolCallingAgent│ LLM 生成 JSON 格式的工具调用│ ││类似OpenAIFunctionCalling│ ││更安全可控但表达力有限│ └─────────────────┴──────────────────────────────────────┘用同一个任务对比from smolagents importCodeAgent,ToolCallingAgent tools [lookup_population, lookup_gdp] task 比较中国、美国和日本的人口和 GDP哪个国家的人均 GDP 最高 # CodeAgent一步搞定 code_agent CodeAgent(toolstools, modelmodel) result code_agent.run(task) # LLM 写了一个 for 循环一次查完 3 个国家的数据直接算出结果 # ToolCallingAgent需要多步 tc_agent ToolCallingAgent(toolstools, modelmodel) result tc_agent.run(task) # LLM 每次只能调一个工具查中国人口 → 查中国GDP → 查美国人口 → ...CodeAgent 的执行过程1-2 步# LLM 生成的代码一步内完成 countries [中国,美国,日本] for c in countries: pop lookup_population(c) gdp lookup_gdp(c) print(f{c}: 人口{pop}, GDP{gdp}) # 然后直接计算人均 GDP给出答案ToolCallingAgent 的执行过程6 步Step0:调用 lookup_population(中国)→14.1 亿 Step1:调用 lookup_gdp(中国)→17.8 万亿美元 Step2:调用 lookup_population(美国)→3.3 亿 Step3:调用 lookup_gdp(美国)→25.5 万亿美元 Step4:调用 lookup_population(日本)→1.25 亿 Step5:调用 lookup_gdp(日本)→4.2 万亿美元 Step6:计算并给出答案选择建议学习和原型阶段→ CodeAgent更灵活高效生产环境→ ToolCallingAgent更安全可控或 CodeAgent 沙箱7、多 Agent 协作初探当任务足够复杂时一个 Agent 搞不定。smolagents 支持 Manager-Worker 模式┌──────────────┐ │Manager│←接收用户任务决定分发给谁 │Agent│ └──────┬───────┘ │分发任务 ┌──────┴───────┐ ││ ▼▼ ┌────────┐┌────────────┐ │Search││Analyst│ │Agent││Agent│ │搜索信息││分析推理│ └────────┘└────────────┘# Worker 1搜索 Agent search_agent CodeAgent( tools[search_tech_news, search_company_info], modelmodel, namesearch_agent, description搜索 Agent负责搜索科技新闻和公司信息。当需要查找事实性信息时交给它。, ) # Worker 2分析 Agent analyst_agent CodeAgent( tools[], modelmodel, nameanalyst_agent, description分析 Agent负责数据分析、趋势判断和撰写报告。当需要对信息进行深度分析时交给它。, add_base_toolsTrue, ) # Manager管理两个 Worker manager CodeAgent( tools[], modelmodel, managed_agents[search_agent, analyst_agent], ) result manager.run( 请帮我分析当前 AI 行业的竞争格局。先搜索 AI 领域的最新新闻和主要公司OpenAI、Anthropic、Google的信息然后基于这些信息写一份简短的行业分析报告。 )Manager 把 Worker 当作工具来使用——它读 Worker 的description决定把子任务分给谁。Worker 执行完后把结果返回给 ManagerManager 汇总后给出最终答案。多 Agent 的核心价值专业分工。搜索 Agent 专注信息检索分析 Agent 专注推理总结各司其职。8、Agent 调控三板斧8.1 max_steps — 防止无限循环Agent 可能陷入死循环反复尝试同一个失败的操作。max_steps是安全阀limited_agent CodeAgent(tools[fibonacci], modelmodel, max_steps2) # 给一个需要很多步的任务但只允许 2 步 result limited_agent.run(计算斐波那契第 5、10、15、20、25、30 项画出增长趋势。) # Agent 会在 2 步内尽力完成超出则停止默认值通常是 6-10 步。简单任务设小一点2-3复杂任务设大一点8-10。8.2 instructions — 定制 Agent 人设不需要修改 System Prompt 模板直接追加指令agent CodeAgent( tools[], modelmodel, add_base_toolsTrue, instructions你是一个数学教授。回答时用通俗易懂的方式解释就像给学生上课。, )instructions会被追加到 System Prompt 末尾是最简单的定制方式。8.3 planning_interval — 定期反思复杂任务中Agent 可能走偏。planning_interval让它每 N 步暂停更新已知事实、反思进展、调整计划planning_agent CodeAgent( tools[search_database, get_user_budget], modelmodel, planning_interval2,# 每 2 步反思一次 max_steps8, )这三个参数覆盖了 80% 的 Agent 调优需求。9、生产环境注意事项CodeAgent 让 LLM 生成并执行代码这意味着安全风险。在部署到生产环境前需要了解四类威胁威胁类型说明风险等级LLM 自身错误LLM 无意中生成有害命令低供应链攻击使用被篡改的 LLM 模型中Prompt 注入Agent 浏览网页时遇到恶意指令高公开暴露恶意用户构造对抗性输入高smolagents 提供多种沙箱方案方案安全级别适用场景Local默认AST 沙箱开发/学习E2B云端隔离云端生产环境Docker容器隔离本地生产环境Blaxel云端 VM低延迟生产开发阶段用默认的 Local executor 足够。生产阶段必须上 E2B 或 Docker 沙箱加上输入验证和输出过滤。10、总结与下一步这篇文章我们走过了 Agent 的完整认知路径Agent LLM 工具循环。LLM 是大脑工具是手ReAct 循环是行动引擎。ReAct Thought Action Observation。交替思考和行动每步都有真实观察来校准推理。我们从 50 行纯 Python 手写了一个 ReAct Agent理解了底层原理再用 smolagents 框架看到了工业级实现。CodeAgent 写代码更灵活ToolCallingAgent 调 JSON 更安全。多 Agent 实现专业分工。那么如何学习大模型 AI 对于刚入门大模型的小白或是想转型/进阶的程序员来说最头疼的就是找不到系统、全面的学习资源要么零散不成体系要么收费高昂白白浪费时间走弯路。今天就给大家精心整理了一份全面且免费的AI大模型学习资源包覆盖从入门到实战、从理论到面试的全流程所有资料均已整理完毕免费分享给各位核心包含AI大模型全套系统化学习路线图小白可直接照做、精品学习书籍电子文档、干货视频教程、可直接上手的实战项目源码、2026大厂面试真题题库一站式解决你的学习痛点不用再到处搜集拼凑扫码免费领取全部内容1、大模型系统化学习路线学习大模型方向比努力更重要很多小白入门就陷入“盲目看视频、乱刷资料”的误区最后越学越懵。这里给大家整理的这份学习路线是结合2026年大模型行业趋势和新手学习规律设计的最科学、最系统从零基础到精通每一步都有明确指引帮你节省80%的无效学习时间少走弯路、高效进阶。2、大模型学习书籍文档理论是实战的根基尤其是对于程序员来说想要真正吃透大模型原理离不开优质的书籍和文档支撑。本次整理的书籍和电子文档均由大模型领域顶尖专家、大厂技术大咖撰写涵盖基础入门、核心原理、进阶技巧等内容语言通俗易懂既有理论深度又贴合实战场景小白能看懂程序员能进阶为后续实战和面试打下坚实基础。3、AI大模型最新行业报告无论是小白了解行业、规划学习方向还是程序员转型、拓展业务边界都需要紧跟行业趋势。本次整理的2026最新大模型行业报告针对互联网、金融、医疗、工业等多个主流行业系统调研了大模型的应用现状、发展趋势、现存问题及潜在机会帮你清晰了解哪些行业更适合大模型落地哪些技术方向值得重点深耕避免盲目学习精准对接行业需求。值得一提的是报告还包含了多模态、AI Agent等前沿方向的发展分析助力大家把握技术风口。4、大模型项目实战配套源码对于程序员和想落地能力的小白来说“光说不练假把式”只有动手实战才能真正巩固所学知识将理论转化为实际能力。本次整理的实战项目涵盖基础应用、进阶开发、多场景落地等类型每个项目都附带完整源码和详细教程从简单的ChatPDF搭建到复杂的RAG系统开发、大模型部署难度由浅入深小白可逐步上手程序员可直接参考优化既能练手提升技术又能丰富简历为求职和职业发展加分。5、大模型大厂面试真题2026年大模型面试已从单纯考察原理转向侧重技术落地和业务结合的综合考察很多程序员和新手因为缺乏针对性准备明明技术不错却在面试中失利。为此我精心整理了各大厂最新大模型面试真题题库涵盖基础原理、Prompt工程、RAG系统、模型微调、部署优化等核心考点不仅有真题还附带详细解题思路和行业踩坑经验帮你精准把握面试重点提前做好准备面试时从容应对、游刃有余。6、四阶段精细化学习规划附时间节点可直接照做结合上述资源给大家整理了一份可直接落地的四阶段学习规划总时长约2个月小白可循序渐进程序员可根据自身基础调整节奏高效掌握大模型核心能力快速实现从“入门”到“能落地、能面试”的跨越。第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AI Agent新手入门：从零开始学习大模型，收藏这份学习指南

最新文章

实时系统调度算法：RM与EDF原理与应用对比

windows 2016 模板机安装 CloudbaseInitSetup_x64

合宙ESP32C3玩转LVGL：手把手解决TFT_eSPI横屏显示偏移（附中景园1.47/1.14屏配置）

STM32F429的“免费GPU”：DMA2D模块详解与在TouchGFX中的实战配置

压缩感知技术：突破香农极限的信号采集革命

空洞骑士模组管理革命：Lumafly一键安装300+模组的终极解决方案

推荐文章

C++20中views的学习与实战练习

从Buck到LLC：一份用Pspice玩转SiC MOSFET四大经典拓扑的仿真实验手册

从零到一：MATLAB tf函数实战指南与进阶技巧

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

如何在苹果设备上运行Windows和Linux：UTM虚拟机完整指南

订单分库分表怎么设计？一次讲清拆分维度、全局 ID、分页查询与跨库问题

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

告别模拟器：5个简单步骤在Windows上直接运行Android应用

为什么你的量子容器在Docker 27上OOM崩溃？——基于Linux cgroups v2 + QVM内存隔离的12条硬核调优指令

终极桌面监控神器：TrafficMonitor插件完整指南，打造个性化系统仪表盘

WebPlotDigitizer：当计算机视觉遇见科研数据挖掘的智能革命

从存储密码到数据校验：Oracle数据库MD5函数的几个实战应用场景（含PL/SQL代码）

从图纸到代码：如何用可编辑架构图提升深度学习开发效率

Windows APK安装器：告别模拟器，直接在Windows上安装Android应用

保姆级教程：在树莓派4B上配置Linux PWM风扇驱动，实现智能温控

Cesium加载GeoJSON数据避坑指南：从阿里云DataV获取中国地图到3D可视化

别再为GPU发愁了！用Colab免费GPU从零训练你的第一个PaddleOCR文本检测模型

终极解密指南：如何快速免费解密RPG Maker加密文件？

用Xilinx PCIe IP核实现自定义寄存器读写：从官方例程到Windriver调试全流程

AI Agent新手入门：从零开始学习大模型，收藏这份学习指南

最新文章

实时系统调度算法：RM与EDF原理与应用对比

windows 2016 模板机安装 CloudbaseInitSetup_x64

合宙ESP32C3玩转LVGL：手把手解决TFT_eSPI横屏显示偏移（附中景园1.47/1.14屏配置）

STM32F429的“免费GPU”：DMA2D模块详解与在TouchGFX中的实战配置

压缩感知技术：突破香农极限的信号采集革命

空洞骑士模组管理革命：Lumafly一键安装300+模组的终极解决方案

推荐文章

C++20中views的学习与实战练习

从Buck到LLC：一份用Pspice玩转SiC MOSFET四大经典拓扑的仿真实验手册

从零到一：MATLAB tf函数实战指南与进阶技巧

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

如何在苹果设备上运行Windows和Linux：UTM虚拟机完整指南

订单分库分表怎么设计？一次讲清拆分维度、全局 ID、分页查询与跨库问题

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南