大模型RAG

张开发

• 2026/4/14 9:44:35 • 15 分钟阅读

分享文章

大模型RAG1、模型2、OpenAI库的基础使用3、RAG4、LangChain1、模型1 阿里云模型通义大模型阿里云模型指阿里云开源及商用的大模型系列核心品牌为通义大模型Tongyi / Qwen提供云端托管 API与开源模型两类服务2OllamaOllama是开源的本地大模型运行与管理工具定位类似 “大模型领域的 Docker”核心能力是简化本地部署、一键运行主流开源 LLM。优先使用阿里云模型的免费额度性能好其次再选用Ollama2、OpenAI库的基础使用OpenAI库是OpenAI公司发布的Python SDK方便与编程调用其产品现许多模型服务商都兼容OpenAI SDK的调用。使用主要就3个流程创建客户端对象OpenAI类对象和模型对话client.chat.completions.create可以提供3个角色使用system: 设定模型的行为和规则assistant: 设定模型的回答由用户设定user: 用户的提问处理结果response.choices[0].message.contentfromopenaiimportOpenAI# 1. 获取client对象OpenAI类对象clientOpenAI(base_urlhttps://dashscope.aliyuncs.com/compatible-mode/v1)# 2. 调用模型responseclient.chat.completions.create(modelqwen3-max,messages[{role:system,content:你是一个Python编程专家并且不说废话简单回答},{role:assistant,content:好的我是编程专家并且话不多你要问什么},{role:user,content:输出1-10的数字使用python代码}])# 3. 处理结果print(response.choices[0].message.content)3、RAG通用的基础大模型存在一些问题LLM大模型语言的知识不是实时的模型训练好后不具备自动更新知识的能力会导致部分信息滞后LLM大模型语言领域知识是缺乏的大模型的知识来源于训练数据这些数据主要来自公开的互联网和开内部知识幻觉问题LLM大模型语言有时会在回答中生成看似合理但实际上是错误的信息数据安全RAGRetrieval-Augmented Generation即检索增强生成为大模型提供了从特定数据源检索到的信息以此来修正和补充生成的答案。可以总结为一个公式RAG 检索技术 LLM 提示RAG 标准流程RAG 标准流程由索引Indexing、检索Retriever和生成Generation三个核心阶段组成。索引阶段通过处理多种来源多种格式的文档提取其中文本将其切分为标准长度的文本块chunk并进行嵌入向量化embedding向量存储在向量数据库vector database中。加载文件内容提取文本分割形成chunk文本向量化存向量数据库检索阶段用户输入的查询query被转化为向量表示通过相似度匹配从向量数据库中检索出最相关的文本块。query向量化在文本向量中匹配出与问句向量相似的top_k个生成阶段检索到的相关文本与原始查询共同构成提示词Prompt输入大语言模型LLM生成精确且具备上下文关联的回答。匹配出的文本作为上下文和问题一起添加到prompt中提交给LLM生成答案RAG的核心价值解决知识时效性问题大模型的训练数据有截止时间RAG 可以接入最新文档如公司财报、政策文件让模型输出“与时俱进”。降低模型幻觉模型的回答基于检索到的事实性资料而非纯靠自身记忆大幅减少编造信息的概率。无需重新训练模型相比微调Fine-tuningRAG 只需更新知识库成本更低、效率更高。4、LangChainLangChain模型组件提供了与各种模型的集成并为所有模型提供一个精简的统一接口。LangChain目前支持三种类型的模型LLMs大语言模型、Chat Models聊天模型、Embeddings Models嵌入模型。LLMs是技术范畴的统称指基于大参数量、海量文本训练的 Transformer 架构模型核心能力是理解和生成自然语言主要服务于文本生成场景聊天模型是应用范畴的细分是专为对话场景优化的 LLMs核心能力是模拟人类对话的轮次交互主要服务于聊天场景文本嵌入模型文本嵌入模型接收文本作为输入得到文本的向量。LangChain支持的三类模型它们的使用场景不同输入和输出不同开发者需要根据项目需要选择相应。

更多文章

前端开发 2026/4/14 9:42:09

Cursor界面深度定制：从Settings汉化到个性化语言包制作

1. 为什么需要深度定制Cursor界面？ 作为一名长期使用Cursor的开发者，我深刻理解官方英文界面带来的不便。每次打开设置菜单都要在脑海中自动翻译，特别是团队协作时，非技术背景成员面对满屏英文设置项时的茫然表情让我印象深刻。Cu…

5个核心功能揭秘：VRM-Addon-for-Blender如何彻底改变3D角色创作流程【免费下载链接】VRM-Addon-for-Blender VRM Importer, Exporter and Utilities for Blender 2.93 to 5.1 项目地址: https://gitcode.com/gh_mirrors/vr/VRM-Addon-for-Blender VRM-Addon…

张开发

前端开发 2026/4/14 9:26:40

如何3分钟完成原神成就数据导出：YaeAchievement终极自动化工具完整指南

如何3分钟完成原神成就数据导出：YaeAchievement终极自动化工具完整指南【免费下载链接】YaeAchievement 更快、更准的原神数据导出工具项目地址: https://gitcode.com/gh_mirrors/ya/YaeAchievement 还在为手动记录原神成就进度而烦恼吗？每次想…

张开发

大模型RAG

最新文章

【多模态架构避坑指南】：已上线的12个工业级项目中，87%因忽略“模态时序异步性”导致推理延迟飙升300%

gte-base-zh部署架构演进：从单机Xinference到K8s集群化Embedding服务

深入解析camelCase与PascalCase：编程命名约定的最佳实践

运维人必备：用Docker Compose一键部署LibreSpeed，打造企业内部网络质量监控看板

突破Cursor Pro限制：智能机器ID重置与多账户管理终极指南

CogVideoX-2b创意工坊：艺术展览动态海报生成实验

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

Cursor界面深度定制：从Settings汉化到个性化语言包制作

Java+springboot整合工作流审批代码源码

项目实训开发日志（二）

FPGA远程升级避坑指南：用AXI Quad SPI管理Flash分区与双镜像备份

别再对着官方文档发愁了！手把手教你用VS2019搞定DALSA采集卡CameraLink二次开发（附完整C++代码）

GLM-4.1V-9B-Base在教育培训中的应用：试卷题目图片智能识别与解答

HunyuanVideo-Foley跨平台部署：从Windows到Linux的迁移与适配教程

CefFlashBrowser：Flash内容终极解决方案，让经典重现的专业工具

ETA6010S2F,可调电流限制功能的精密负载开关

专业级数据采集工具：深度解析大众点评爬虫技术实现与反爬对抗方案

5个核心功能揭秘：VRM-Addon-for-Blender如何彻底改变3D角色创作流程

如何3分钟完成原神成就数据导出：YaeAchievement终极自动化工具完整指南

大模型RAG

最新文章

【多模态架构避坑指南】：已上线的12个工业级项目中，87%因忽略“模态时序异步性”导致推理延迟飙升300%

gte-base-zh部署架构演进：从单机Xinference到K8s集群化Embedding服务

深入解析camelCase与PascalCase：编程命名约定的最佳实践

运维人必备：用Docker Compose一键部署LibreSpeed，打造企业内部网络质量监控看板

突破Cursor Pro限制：智能机器ID重置与多账户管理终极指南

CogVideoX-2b创意工坊：艺术展览动态海报生成实验

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南