RNN，LSTM，BiLSTM算法介绍（NLP-AHU-110）

张开发

• 2026/6/6 15:05:20 • 15 分钟阅读

分享文章

1. RNNRecurrent Neural Network1.1 启发来源传统神经网络无法处理序列文本、语音、时序。受人类阅读 / 思考方式启发当前信息依赖之前信息。因此设计循环连接让隐藏状态携带历史信息。1.2 结构设计1. 每个时间步共享同一套权重2. 隐藏状态 hₜ 由上一时刻 hₜ₋₁和当前输入 xₜ共同决定1.3 算法细节输入序列 x₁, x₂, ..., x_T隐藏状态更新输出 yₜ 由 hₜ 映射得到1.4 数学表达计算新的隐藏状态 (ht):计算输出 (yt):1.5 致命问题梯度消失 / 爆炸2. LSTMLong Short-Term Memory2.1 启发来源解决 RNN 梯度消失。受大脑记忆机制启发1. 记住重要信息2. 忘记不重要信息3. 控制信息流动因此设计门控机制gate2.2 结构设计3 个门 1 个细胞状态 C记忆传送带1. 遗忘门 fₜ忘记什么2. 输入门 iₜ保存什么3. 输出门 oₜ输出什么4. 细胞状态 Cₜ长期记忆2.3 算法细节1. 细胞状态 C 像一条传送带只做线性运算梯度不易消失2. 门用 sigmoid 输出 0~1控制信息通过比例2.4 数学表达标准 LSTM遗忘门输入门细胞状态更新输出门1. ⊙按元素相乘Hadamard product2. σsigmoid输出 0~13. BiLSTMBidirectional LSTM3.1 启发来源自然语言中当前词不仅依赖前文也依赖后文。例“我___喜欢这部电影因为它很感人。”空处需要后文才能判断。因此设计正向 LSTM 反向 LSTM。3.2 结构设计1. 前向 LSTMht1→T2. 后向 LSTMhtT→13.3 算法细节1. 正向走一遍2. 反向走一遍3. 每个时刻输出 3.4 数学表达[ ; ]表示拼接concatenation)4. 三者关系总结超清晰1. RNN基础循环梯度消失2. LSTM门控解决长依赖3. BiLSTM双向 LSTM利用上下文

RNN，LSTM，BiLSTM算法介绍（NLP-AHU-110）

最新文章

PAT乙级刷题避坑指南：从‘我要通过！’到‘狼人杀’，那些题目里没说清的隐藏考点

从芯片设计到客户手里：揭秘AE、FAE、PE、VE如何接力完成一颗IC的旅程

用PaddleOCR v3搞定80种语言图片文字提取：从安装到实战避坑全记录

保姆级避坑指南：在ROS Noetic上搞定aruco_ros编译与单目相机定位（解决CV_FILLED报错）

碧蓝航线Alas脚本完整指南：自动化游戏终极解决方案

FUXA工业级可视化监控系统：5天从零构建专业SCADA平台的完整指南

推荐文章

相关文章

分享文章

更多文章

生物信息学——PacBio HiFi测序技术：从原理到实战应用

CSS如何设置元素外边距合并问题_利用BFC块级格式化上下文

OpenClaw排错大全：Phi-3-mini-128k-instruct接口连接失败7种解决方案

应届生面试死在自我介绍，90%都踩过坑

省下仿真器钱！用5元USB转TTL给STM32C8T6烧程序的保姆级教程

WPFOpenCV高级显示控件2.0全新优化，新增直观图像拖入加载与显示功能，采用WPF原生...

MMC整流器平均值模型simulink仿真，19电平，采用交流电流内环，直流电压外环控制，双二...

华为1+X《网络系统建设与运维(中级)》认证实验全流程解析与实战技巧

汇川CodeSys PLC组态实战：从网络配置到硬件集成的核心步骤解析

GD32F303实战入门：从内核解析到驱动架构设计

DevOps文化中的工具链集成自动化流程与团队协作

掌握Blender 3MF插件：5大核心场景的全流程解决方案