[卷积神经网络]YOLOv11实战：从零构建自定义数据集训练流程

张开发

• 2026/6/7 18:28:58 • 15 分钟阅读

分享文章

1. 数据集准备与格式转换第一次用YOLOv11训练自己的模型时最头疼的就是数据集处理。我的数据是VOC格式的但YOLO需要特定的文本标注格式。这里分享一个我验证过的完整转换方案包含几个容易踩坑的细节。VOC转YOLO格式的核心是坐标归一化处理。VOC使用绝对坐标(xmin,ymin,xmax,ymax)而YOLO需要转换为相对坐标(x_center,y_center,width,height)。我写了个Python脚本自动处理import xml.etree.ElementTree as ET def convert_box(size, box): dw 1./size[0] dh 1./size[1] x (box[0] box[2])/2.0 y (box[1] box[3])/2.0 w box[2] - box[0] h box[3] - box[1] x x * dw w w * dw y y * dh h h * dh return (x,y,w,h) def convert_annotation(xml_file, txt_file, classes): tree ET.parse(xml_file) root tree.getroot() size root.find(size) w int(size.find(width).text) h int(size.find(height).text) with open(txt_file, w) as f: for obj in root.iter(object): cls obj.find(name).text if cls not in classes: continue cls_id classes.index(cls) xmlbox obj.find(bndbox) b (float(xmlbox.find(xmin).text), float(xmlbox.find(ymin).text), float(xmlbox.find(xmax).text), float(xmlbox.find(ymax).text)) bb convert_box((w,h), b) f.write(f{cls_id} { .join([str(a) for a in bb])}\n)实际使用时要注意三点类别顺序必须固定建议用列表不要用字典图像尺寸要从XML里读取不能假设都是统一尺寸路径处理建议用os.path.join避免跨平台问题2. 数据集划分策略数据集划分直接影响模型效果。我习惯用8:1:1的比例分割训练集、验证集和测试集。这里推荐使用sklearn的train_test_split分层抽样from sklearn.model_selection import train_test_split def split_dataset(image_dir, label_dir, test_size0.2): images [f for f in os.listdir(image_dir) if f.endswith(.jpg)] labels [f.replace(.jpg, .txt) for f in images] # 先分训练集和临时集 train_img, temp_img, train_lbl, temp_lbl train_test_split( images, labels, test_sizetest_size, random_state42) # 再分验证集和测试集 val_img, test_img, val_lbl, test_lbl train_test_split( temp_img, temp_lbl, test_size0.5, random_state42) return { train: (train_img, train_lbl), val: (val_img, val_lbl), test: (test_img, test_lbl) }关键点保持图像和标注文件同步分割随机种子固定保证可复现测试集要完全隔离只在最终评估使用3. 配置文件定制YOLOv11需要两个核心配置文件数据配置和模型配置。数据配置示例# VOC.yaml path: ../datasets/VOC train: images/train val: images/val test: images/test nc: 6 # 类别数 names: [person, car, dog, cat, bicycle, motorcycle]模型配置我推荐从官方yolo11s.yaml开始修改# yolo11-custom.yaml nc: 6 # 必须与数据配置一致 scales: s: depth: 0.33 width: 0.50 max_channels: 1024 backbone: # [from, repeats, module, args] - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4 # ...保持其他默认配置特别注意修改nc后要同步调整最后一层Detect的参数小数据集建议用s版本减少过拟合风险输入尺寸保持640x640除非有特殊需求4. 训练过程优化启动训练的核心代码很简单from ultralytics import YOLO model YOLO(yolo11-custom.yaml) results model.train( dataVOC.yaml, epochs100, imgsz640, batch16, device0 )但有几个提升效果的关键技巧学习率预热添加warmup_epochs3参数早停机制patience10当验证集指标不再提升时停止数据增强默认的augment已经很充分不建议新手修改混合精度ampTrue能显著减少显存占用训练过程中要重点关注三个指标train/box_loss检测框回归损失train/cls_loss分类损失val/mAP0.5验证集平均精度5. 模型评估与导出训练完成后用测试集进行最终评估model YOLO(runs/detect/train/weights/best.pt) metrics model.val( dataVOC.yaml, splittest, conf0.5 # 置信度阈值 ) print(fmAP0.5: {metrics.box.map})模型导出为ONNX格式便于部署model.export(formatonnx, dynamicTrue)常见问题处理如果显存不足减小batch_size或imgsz如果过拟合增加数据增强或减少模型规模如果训练不稳定检查数据标注质量6. 实际应用建议在工业项目中我发现这些实践特别有用使用wandb或tensorboard记录训练过程对困难样本进行针对性数据增强尝试不同anchor box设置尤其非常规目标测试时使用TTA(Test Time Augmentation)提升稳定性对于边缘设备部署建议导出时进行量化int8使用TensorRT加速对输出做后处理过滤

更多文章

前端开发 2026/6/7 18:28:52

保姆级教程：为GROMACS 2025.2启用PLUMED增强采样与AI势能（LibTorch）支持，从编译到测试

保姆级教程：为GROMACS 2025.2启用PLUMED增强采样与AI势能（LibTorch）支持，从编译到测试计算化学领域的研究者们，如果你正在寻找一种方法来提升分子动力学模拟的效率和精度，那么GROMACS 2025.2版本结合PLUME…

Splinter JavaScript 执行指南：在自动化测试中动态操作页面【免费下载链接】splinter splinter - python test framework for web applications 项目地址: https://gitcode.com/gh_mirrors/sp/splinter Splinter 是一个强大的 Python Web 应用自动化测试框…

张开发

前端开发 2026/5/14 22:34:23

免费降AI工具和付费工具哪个靠谱：全面对比和选购建议

免费降AI工具和付费工具哪个靠谱：全面对比和选购建议选降AI工具看三点：达标率、价格、处理后文本质量。按这标准我花了一周研究主流工具。结论先说：嘎嘎降AI（www.aigcleaner.com）最适合大多数人——4.8元一篇&…

张开发

[卷积神经网络]YOLOv11实战：从零构建自定义数据集训练流程

最新文章

PAT乙级刷题避坑指南：从‘我要通过！’到‘狼人杀’，那些题目里没说清的隐藏考点

从芯片设计到客户手里：揭秘AE、FAE、PE、VE如何接力完成一颗IC的旅程

用PaddleOCR v3搞定80种语言图片文字提取：从安装到实战避坑全记录

保姆级避坑指南：在ROS Noetic上搞定aruco_ros编译与单目相机定位（解决CV_FILLED报错）

碧蓝航线Alas脚本完整指南：自动化游戏终极解决方案

FUXA工业级可视化监控系统：5天从零构建专业SCADA平台的完整指南

推荐文章

相关文章

分享文章

更多文章

保姆级教程：为GROMACS 2025.2启用PLUMED增强采样与AI势能（LibTorch）支持，从编译到测试

[资料整理]魔法师传奇 MagicMayhem

Unity-URP-Outlines完全指南：7个实用技巧让你轻松实现专业级描边效果

[吾题有解] HDLBits ：Fsm ps2 / Fsm ps2data

Java 变量命名规则

探索基于支持向量数据描述 (SVDD) 的多类分类算法

Win11Debloat优化指南：7步打造高效纯净的Windows系统

WebDataset错误恢复：数据管道故障后的自动恢复机制

如何基于SecGPT构建企业级安全智能助手：完整实践指南

cbindgen性能优化技巧：如何生成最高效的C绑定代码

Splinter JavaScript 执行指南：在自动化测试中动态操作页面

免费降AI工具和付费工具哪个靠谱：全面对比和选购建议