大模型---大模型的参数微调

张开发

• 2026/4/19 4:20:06 • 15 分钟阅读

分享文章

目录一.全参微调二.PERT1.LoRA/QLoRA（1）LoRA（2）QLoRA2.Prompt Tuning/Prefix Tuning/P-Tuning v2（1）Prompt Tuning（2）Prefix Tuning（3）P-Tuning v2（4）与LoRA的区别三.微调方式的选择四.MPT(Multitask Prompt Tuning)微调(Fine-tuning)是指在预训练模型的基础上，使用特定任务的数据集对模型进行进一步训练的过程。其核心思想是利用大规模通用数据上预先训练好的模型，通过少量特定领域数据的继续训练，使模型快速适应新的任务，同时避免从头训练所需的大量计算和数据。一.全参微调全参微调就是基座模型所有可训练参数都参与更新。它的优点是表达能力最强，不受适配器容量上限约束；缺点是训练和存储都最贵，所以一般不作为微调出发点。二.PERT参数高效微调(Parameter-Efficient Fine-Tuning，简称PEFT)是一种针对大型预训练模型(如大语言模型)的微调技术，它旨在减少训练参数的数量，从而降低计算和存储成本，同时保持或提升模型性能。PEFT通过仅微调模型中的一小部分参数，而不是整个模型，来适应特定的下游任务。这种方法特别适用于硬件资源受限的情况，以及需要快速适配多种任务的大型模型。PERT大概分为四路：① 重新参数化冻结预训练权重，只训练注入的低秩矩阵。也就是，不直接改原权重，而是在原线性层旁边挂一个低秩更新。代表就是LoRA。② 增加小模块在层间插入小瓶颈模块，只训练这些模块；在多个下游任务场景下，比每个任务都复制一整套模型更省参数。代表就是Adapter Tuning。③ 软提示/前缀代表是Prompt Tuning / Prefix Tuning / P-Tuning v2。尽量保持主模型冻结，只训练一小段可学习的连续提示。差别主要在“提示加在输入前面”还是“深入到每层/每个注意力块里”。④ 选择性训练一小部分原参数这类做法也存在，但最常见的主线仍然是LoRA / QLoRA。1.LoRA/QLoRA（1）LoRALoRA的观点是模型从通用能力到某个具体任务，所需的权重改动，往往落在一个相对低维的子空间里。LoRA不直接更新原始权重矩阵W，而是把更新写成一个低秩分解=BA。训练时冻结W，只训练低秩矩阵；部署时把这部分合并回原权重，从推理角度看，最后还是一层普通线性变换，因此理论上不会额外增加推理延迟。具体来说，在训练阶段，原始权重W冻结不动，LoRA分支A，B参与前向和反向，梯度只更新A，B。所以，模型参数总数虽然很大，但可训练参数量很小，优化器状态也主要只为LoRA参数维护，这也是为什么 LoRA 在大模型上能显著降低训练成本。LoRA有个关键的超参数r（rank），这是低秩分解的秩，直接控制适配器容量。rank越大，表达能力一般越强，但显存和训练成本也会上升。LoRA的设计目标就是通过更少参数逼近全参效果，但如果rank太小，目标层选得不对，数据分布变化太大时，它会受限于适配器容量。捋一下LoRA训练流程：(1) 加载基座模型；(2) 配置LoRA，核心配置大概包括：① r：低秩分解的秩，可以看作LoRA适配器的容量旋钮，r越小，可训练参数更少，显存更省，正则化更强，但表达能力受限；r大，适配器容量更强，更接近全参微调，但成本会上升；② lora_alpha：缩放因子，控制LoRA分支的更新幅度，不让低秩分支一上来就把原模型行为改得太猛。③ lora_dropout：LoRA 层的 dropout 概率，对LoRA分支做正则化，防止适配器在小数据场景下过拟合；(3) 冻结主模型，只训练adaper；（4）训练，优化器只更新可训练adapter 参数，所以训练更轻。（5）在任务切换时，只换adapter，而不是换整个模型；部署时还可以 merge 到主权重里。

更多文章

前端开发 2026/4/19 4:17:40

UvA Deep Learning Tutorials对抗攻击防御：保护深度学习模型的10个安全策略

UvA Deep Learning Tutorials对抗攻击防御：保护深度学习模型的10个安全策略【免费下载链接】uvadlc_notebooks Repository of Jupyter notebook tutorials for teaching the Deep Learning Course at the University of Amsterdam (MSc AI), Fall 2022/Spring 2022…

张开发

前端开发 2026/4/19 4:18:11

如何精通逆向工程：从InitializePlayer函数深入内存拷贝与数据结构分析

如何精通逆向工程：从InitializePlayer函数深入内存拷贝与数据结构分析【免费下载链接】Z0FCourse_ReverseEngineering Reverse engineering focusing on x64 Windows. 项目地址: https://gitcode.com/gh_mirrors/z0/Z0FCourse_ReverseEngineering 逆向工程是…

1. ClickHouse数据迁移的核心场景每次接手新项目时，最让我头疼的就是数据迁移问题。特别是当数据量达到TB级别，传统的数据库导入导出方式就像用吸管喝珍珠奶茶——不仅慢，还经常卡住。ClickHouse的S3集成功能彻底改变了这个局面，…

张开发

大模型---大模型的参数微调

最新文章

如何计算SQL日期差值_使用DATEDIFF函数实现逻辑判断

如何配置MySQL用户的密码复杂度要求_结合phpMyAdmin与密码校验插件

【2026 AGI实战分水岭】：从SITS2026原型看通用智能系统4层验证体系——你还在用准确率衡量AGI吗？

3天内完成百万行COBOL→Python迁移？2026奇点大会演示银行核心系统零误差转换全流程

Cadence Allegro PCB设计：5个必学的临时快捷键设置技巧（含旋转/翻转）

仅剩72小时！奇点大会回滚建议API公测通道即将关闭：手把手接入支持Python/TypeScript/Rust的实时建议SDK

推荐文章

C++20中views的学习与实战练习

从Buck到LLC：一份用Pspice玩转SiC MOSFET四大经典拓扑的仿真实验手册

从零到一：MATLAB tf函数实战指南与进阶技巧

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

如何在苹果设备上运行Windows和Linux：UTM虚拟机完整指南

订单分库分表怎么设计？一次讲清拆分维度、全局 ID、分页查询与跨库问题

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

UvA Deep Learning Tutorials对抗攻击防御：保护深度学习模型的10个安全策略

如何精通逆向工程：从InitializePlayer函数深入内存拷贝与数据结构分析

【Triton 教程】math-ops

如何为Whisper ASR Webservice开发自定义引擎和插件

还在为H5页面开发头疼吗？开源编辑器h5maker让你5分钟搞定专业级设计

如何在DroidKaigi 2024官方应用中实现高效列表展示：Compose最佳实践指南

AIGlasses_for_navigation开发者社区：CSDN博客写作与技术分享指南

intv_ai_mk11详细步骤：24GB单卡部署Llama模型并启用Web UI全流程

ESP32隐藏技能：5分钟搭建带记忆功能的WiFi配网服务器（PlatformIO全流程）

探秘书匠策AI：毕业论文写作的“智能魔法师”

FastAPI日志配置终极指南：10个简单步骤实现生产级日志管理

ClickHouse数据高效迁移：从S3到本地的全流程实践

大模型---大模型的参数微调

最新文章

如何计算SQL日期差值_使用DATEDIFF函数实现逻辑判断

如何配置MySQL用户的密码复杂度要求_结合phpMyAdmin与密码校验插件

【2026 AGI实战分水岭】：从SITS2026原型看通用智能系统4层验证体系——你还在用准确率衡量AGI吗？

3天内完成百万行COBOL→Python迁移？2026奇点大会演示银行核心系统零误差转换全流程

Cadence Allegro PCB设计：5个必学的临时快捷键设置技巧（含旋转/翻转）

仅剩72小时！奇点大会回滚建议API公测通道即将关闭：手把手接入支持Python/TypeScript/Rust的实时建议SDK

推荐文章

C++20中views的学习与实战练习

从Buck到LLC：一份用Pspice玩转SiC MOSFET四大经典拓扑的仿真实验手册

从零到一：MATLAB tf函数实战指南与进阶技巧

Elasticsearch 运维必备：列出集群所有索引的5种方法（最全+图解+实战）

如何在苹果设备上运行Windows和Linux：UTM虚拟机完整指南

订单分库分表怎么设计？一次讲清拆分维度、全局 ID、分页查询与跨库问题

相关文章

3步告别Windows臃肿：Win11Debloat让你的电脑重获新生

从STM32到AI：嵌入式开发者如何理解Qwen-Image-Edit-F2P的模型推理流程

LVDS信号测试进阶：用泰克MDO3034的隐藏功能做信号完整性分析

KeychainSwift 未来展望：路线图与社区发展计划

DotNetPy：现代.NET 与 Python 互操作 实战指南

Rocky Linux 9 安装MySQL 8.0避坑指南：从安装到安全加固

分享文章

更多文章

DotNetPy：现代.NET 与 Python 互操作实战指南