如何为你的AI助手打造“长期记忆“系统？小白/程序员必备收藏，从架构到代码实现深度解析

张开发

• 2026/4/13 7:43:33 • 15 分钟阅读

分享文章

如何为你的AI助手打造“长期记忆“系统？小白/程序员必备收藏，从架构到代码实现深度解析

本文深入探讨了为AI Agent构建持久化记忆系统的必要性分析了LLM上下文窗口有限等局限性。文章详细介绍了分层架构设计涵盖记忆条目分类、相关性评分算法、存储抽象支持内存和SQLite、环形缓冲区实现短期记忆、向量嵌入进行语义搜索以及多因子相关性排序。通过实战示例展示了基本使用方法和自定义配置最后展望了向量数据库集成、记忆压缩等未来方向为开发者实现智能AI助手提供了一套完整的参考方案。为什么 AI Agent 需要记忆系统LLM 的局限性大语言模型虽然强大但存在一个根本性的限制上下文窗口有限。即使最新的模型支持百万级 tokens也无法记住所有历史对话。更重要的是•成本问题每次都传递完整历史API 调用费用会快速累积•注意力稀释上下文过长会导致模型注意力分散回复质量下降•无法持久化新会话无法访问旧会话的信息记忆系统的价值一个设计良好的记忆系统可以• ✅跨会话记忆记住用户的偏好、历史交互• ✅智能检索只召回与当前对话相关的内容• ✅知识沉淀将交互中提取的知识长期保存• ✅成本优化通过检索替代完整上下文传递系统架构概览agent-io 的记忆系统采用分层架构设计核心模块职责模块职责文件MemoryManager统一入口协调各组件manager.rsMemoryEntry记忆条目数据结构entry.rsMemoryStore存储抽象 traitstore.rsRingBuffer短期记忆的环形缓冲区buffer.rsEmbeddingProvider文本向量化接口embeddings.rsMemoryRanker记忆相关性排序ranker.rs核心组件详解记忆条目MemoryEntry每条记忆都是一个结构化的条目pub struct MemoryEntry { pub id: String, // 唯一标识 pub content: String, // 记忆内容 pub embedding: OptionVecf32, // 向量表示用于相似度搜索 pub memory_type: MemoryType, // 记忆类型 pub metadata: HashMapString, Value, // 元数据 pub created_at: DateTimeUtc, // 创建时间 pub last_accessed: OptionDateTimeUtc, // 最后访问时间 pub importance: f32, // 重要性评分 (0.0 - 1.0) pub access_count: u32, // 访问次数}记忆类型分类pub enum MemoryType { ShortTerm, // 短期记忆最近的对话 LongTerm, // 长期记忆持久化知识 Episodic, // 情景记忆特定事件/经历 Semantic, // 语义记忆事实和概念}这种分类借鉴了认知心理学中的记忆模型•短期记忆容量有限快速存取类似工作记忆•长期记忆容量无限需要检索才能访问•情景记忆个人经历如昨天我去了咖啡店•语义记忆通用知识如巴黎是法国首都相关性评分算法系统会根据多个因素动态计算记忆的相关性pub fn relevance_score(self) - f32 { let age_hours (Utc::now() - self.created_at).num_hours() as f32; let recency_factor (-age_hours / 24.0 / 7.0).exp(); // 一周内指数衰减 let access_factor 1.0 (self.access_count as f32).ln().max(0.0) * 0.1; self.importance * recency_factor * access_factor}评分公式score 重要性 × 时间衰减因子 × 访问频率因子存储抽象MemoryStore采用 Trait 抽象存储层支持多种后端实现#[async_trait]pub trait MemoryStore: Send Sync { async fn add(self, entry: MemoryEntry) - ResultString; async fn search(self, query: str, limit: usize) - ResultVecMemoryEntry; async fn search_by_embedding(self, embedding: [f32], limit: usize, threshold: f32) - ResultVecMemoryEntry; async fn get(self, id: str) - ResultOptionMemoryEntry; async fn update(self, entry: MemoryEntry) - Result(); async fn delete(self, id: str) - Result(); async fn clear(self) - Result(); async fn count(self) - Resultusize;}内存存储实现适合开发测试所有数据保存在内存中pub struct InMemoryStore { memories: RwLockHashMapString, MemoryEntry,}支持向量相似度搜索余弦相似度fn cosine_similarity(a: [f32], b: [f32]) - f32 { let dot: f32 a.iter().zip(b.iter()).map(|(x, y)| x * y).sum(); let norm_a: f32 a.iter().map(|x| x * x).sum::f32().sqrt(); let norm_b: f32 b.iter().map(|x| x * x).sum::f32().sqrt(); dot / (norm_a * norm_b)}SQLite 存储实现适合生产环境支持持久化和全文搜索pub struct SqliteStore { conn: ArcMutexConnection,}数据库设计亮点FTS5 全文搜索利用 SQLite 的 FTS5 扩展实现高效文本搜索向量存储将向量序列化为 BLOB 存储自动触发器插入/更新/删除时自动同步 FTS 索引CREATE VIRTUAL TABLE memories_fts USING fts5( id UNINDEXED, content, contentmemories, content_rowidrowid);-- 自动同步触发器CREATE TRIGGER memories_ai AFTER INSERT ON memories BEGIN INSERT INTO memories_fts(rowid, id, content) VALUES (new.rowid, new.id, new.content);END;短期记忆缓冲区RingBuffer短期记忆采用环形缓冲区实现固定容量自动淘汰最旧的数据pub struct RingBufferT { buffer: VecDequeT, capacity: usize,}implT RingBufferT { pub fn push(mut self, item: T) { if self.buffer.len() self.capacity { self.buffer.pop_front(); // 淘汰最旧的 } self.buffer.push_back(item); }}设计优势• O(1) 时间复杂度的插入和删除• 内存占用可控• 保留最近 N 条对话上下文向量嵌入Embeddings记忆系统依赖向量嵌入实现语义搜索#[async_trait]pub trait EmbeddingProvider: Send Sync { async fn embed(self, text: str) - ResultVecf32; async fn embed_batch(self, texts: [str]) - ResultVecVecf32; fn dimension(self) - usize;}内置实现Provider模型维度OpenAIEmbeddingtext-embedding-3-small1536OpenAIEmbeddingtext-embedding-3-large3072MockEmbedding测试用 Mock可配置记忆排序器Ranker当检索到多条相关记忆时需要按相关性排序pub struct RankingWeights { pub similarity: f32, // 向量相似度权重 (0.4) pub importance: f32, // 重要性权重 (0.25) pub recency: f32, // 时效性权重 (0.2) pub frequency: f32, // 访问频率权重 (0.15)}综合评分公式score 0.4 × similarity 0.25 × importance 0.2 × recency 0.15 × frequency时间衰减机制记忆的重要性会随时间衰减pub struct DecayConfig { pub daily_rate: f32, // 每日衰减率 (默认 1%) pub min_threshold: f32, // 最小阈值 (低于此值的记忆可清理) pub grace_period_days: u32, // 宽限期 (新记忆不衰减)}衰减公式importance × (1 - daily_rate)^days核心工作流程记忆存储流程Rememberpub async fn remember(mut self, content: str, memory_type: MemoryType) - ResultString { // 1. 生成向量嵌入 let embedding self.embedder.embed(content).await?; // 2. 创建记忆条目 let entry MemoryEntry::new(content) .with_type(memory_type) .with_embedding(embedding); // 3. 根据类型选择存储位置 match memory_type { MemoryType::ShortTerm { self.short_term.push(entry.clone()); Ok(entry.id) } _ { if self.config.enable_long_term { self.store.add(entry).await // 持久化存储 } else { self.short_term.push(entry.clone()); Ok(entry.id) } } }}流程图记忆检索流程Recallpub async fn recall(self, query: str) - ResultVecMemoryEntry { // 1. 查询向量化 let query_embedding self.embedder.embed(query).await?; // 2. 从长期记忆检索 let mut memories self.store .search_by_embedding(query_embedding, limit, threshold) .await?; // 3. 从短期记忆检索 for entry in self.short_term.iter_recent() { if let Some(ref embedding) entry.embedding { let similarity cosine_similarity(query_embedding, embedding); if similarity threshold { memories.push(entry.clone()); } } } // 4. 按相关性排序 memories.sort_by(|a, b| b.relevance_score().partial_cmp(a.relevance_score()).unwrap()); // 5. 限制返回数量 memories.truncate(self.config.retrieval_limit); Ok(memories)}流程图实战示例基本使用use agent_io::memory::{ MemoryManager, MemoryConfig, MemoryType, InMemoryStore, MockEmbedding};#[tokio::main]async fn main() - Result() { // 1. 创建存储和向量化服务 let store Arc::new(InMemoryStore::new()); let embedder Arc::new(MockEmbedding::new(384)); // 2. 创建记忆管理器 let config MemoryConfig { short_term_size: 20, enable_long_term: true, retrieval_limit: 5, relevance_threshold: 0.7, ..Default::default() }; let mut manager MemoryManager::new(config, store, embedder); // 3. 存储记忆 manager.remember(用户喜欢 Rust 编程语言, MemoryType::LongTerm).await?; manager.remember(用户是软件工程师, MemoryType::Semantic).await?; manager.remember(上次讨论了异步编程, MemoryType::Episodic).await?; // 4. 检索相关记忆 let memories manager.recall(编程).await?; for memory in memories { println!(相关记忆: {}, memory.content); } // 5. 构建上下文 let context manager.recall_context(用户的技术背景).await?; println!(上下文: {}, context); Ok(())}使用 SQLite 持久化use agent_io::memory::SqliteStore;// 创建文件数据库let store Arc::new(SqliteStore::open(./data/memories.db)?);// 或使用内存数据库测试用let store Arc::new(SqliteStore::new()?);自定义排序权重use agent_io::memory::{MemoryRanker, RankingWeights};let weights RankingWeights { similarity: 0.5, // 更重视语义相似 importance: 0.3, recency: 0.1, frequency: 0.1,};let ranker MemoryRanker::with_weights(weights) .with_recency_half_life(24.0 * 3.0); // 3天半衰期设计亮点总结架构设计特性实现方式存储抽象Trait 多后端实现短期/长期分离RingBuffer Store 双层架构语义搜索Embedding 向量化余弦相似度混合检索FTS 全文向量相似度相关性排序多因子加权评分性能优化•异步设计所有 I/O 操作都是 async支持高并发•批量嵌入embed_batch支持批量向量化减少 API 调用•连接池SQLite 使用ArcMutexConnection安全共享•索引优化SQLite 创建了 memory_type、importance、created_at 索引可扩展性// 自定义存储后端impl MemoryStore for MyCustomStore { ... }// 自定义嵌入服务impl EmbeddingProvider for MyEmbeddingService { ... }未来展望当前的实现已经相当完善但仍有一些可以改进的方向向量数据库集成对于大规模记忆可集成 Qdrant、Milvus 等专业向量数据库记忆压缩使用 LLM 总结压缩旧记忆减少存储空间遗忘机制基于 DecayConfig 实现自动清理低重要性记忆多模态记忆支持图片、音频等多模态记忆存储记忆推理基于记忆进行推理生成新的知识结语这套记忆系统设计体现了认知科学原理与工程实践的结合。通过分层架构、存储抽象、多因子排序等设计实现了既灵活又高效的 AI 记忆能力。希望这些设计思路能为你的 AI Agent 开发提供参考。完整代码请访问GitHub 仓库https://github.com/lispking/agent-io如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2026 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取

如何为你的AI助手打造“长期记忆“系统？小白/程序员必备收藏，从架构到代码实现深度解析

最新文章

仲景中医大语言模型：让传统医学智慧在AI时代焕发新生

LIN总线同步场0x55：一个被低估的“硬件级”时钟校准协议设计剖析

计算机毕业设计:Python天气数据可视化与智能预报系统 Flask框架集成学习可视化和风天气 API 数据分析大数据 AI （建议收藏）✅

WarcraftHelper：让魔兽争霸III在现代电脑上焕发新生的终极解决方案

解决LangChain4j流式输出中文乱码：从编码配置到React前端渲染的完整避坑指南

实测 Claude Code vs 本地 gemma4 大模型

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

7个实战技巧：解决文本分析痛点的关键词提取指南

深入解析URDF中joint与link的坐标转换逻辑

OpenMV 与 OpenCV：嵌入式视觉与通用计算机视觉的深度对比

从67到89：我是如何用YOLO-MASK清洗COCO羊数据集提升模型精度的

WinDiskWriter：3步搞定macOS上Windows启动盘制作难题

4个智能步骤，普通用户如何通过OpCore Simplify实现黑苹果系统一键部署

别再让RK平台自动降频拖慢你的设备！手把手教你关闭温度控制，解锁满血性能

Pixel Aurora Engine环境配置：CUDA/cuDNN/Triton依赖版本兼容性清单

结合方向梯度与小波域残差学习的图像去条纹方法

别再只比精度了！手把手教你用YOLOv5和v7在自定义数据集上做训练优化

别再只会用assign了！手把手教你用Verilog for循环实现4位乘法器（附Modelsim仿真对比）

Outfit字体全面解析与实战指南：现代设计的无衬线字体解决方案

如何为你的AI助手打造“长期记忆“系统？小白/程序员必备收藏，从架构到代码实现深度解析

最新文章

仲景中医大语言模型：让传统医学智慧在AI时代焕发新生

LIN总线同步场0x55：一个被低估的“硬件级”时钟校准协议设计剖析

计算机毕业设计:Python天气数据可视化与智能预报系统 Flask框架 集成学习 可视化 和风天气 API 数据分析 大数据 AI （建议收藏）✅

WarcraftHelper：让魔兽争霸III在现代电脑上焕发新生的终极解决方案

解决LangChain4j流式输出中文乱码：从编码配置到React前端渲染的完整避坑指南

实测 Claude Code vs 本地 gemma4 大模型

推荐文章

PyCharm社区版+Anaconda环境配置全攻略（避坑指南+清华镜像加速）

企业架构实战：从BA到TA的4A架构全解析（附华为架构图参考）

ESP-Bootstrap：面向ESP32/ESP8266的嵌入式Web固件基础架构

实战 | 从模仿学习到强化学习：自动驾驶轨迹规划的范式演进与代码实现

基于计算机视觉的路口交通密度估计

一文搞懂 Python 的 GIL（全局解释器锁）

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

计算机毕业设计:Python天气数据可视化与智能预报系统 Flask框架集成学习可视化和风天气 API 数据分析大数据 AI （建议收藏）✅

DotNetPy：现代.NET 与 Python 互操作实战指南