从ChauffeurNet到PLUTO：模仿学习做自动驾驶规划，这5年我们踩了哪些坑？

张开发

• 2026/6/7 22:18:23 • 15 分钟阅读

分享文章

从ChauffeurNet到PLUTO：模仿学习做自动驾驶规划，这5年我们踩了哪些坑？

模仿学习在自动驾驶规划中的五年进化从ChauffeurNet到PLUTO的技术跃迁当Waymo在2018年开源ChauffeurNet框架时基于模仿学习的自动驾驶规划还停留在栅格地图和简单行为克隆阶段。五年后的今天PLUTO框架在nuPlan基准测试中首次超越了人类专家设计的规则系统标志着这一技术路线迈入成熟期。这场静悄悄的革命背后是模型架构、训练范式和评估体系的全面重构。1. 模仿学习规划的范式转移自动驾驶规划系统的进化史本质上是一部如何处理分布偏移问题的技术史。早期系统如ChauffeurNet采用行为克隆栅格化BEV的架构其核心假设是只要训练数据足够丰富神经网络就能通过端到端学习掌握所有驾驶场景。但现实很快给出否定答案——在开环测试中表现完美的模型一旦进入真实路测就会因误差累积而失效。关键突破点出现在三个维度输入表征从栅格图到向量化表示的转变模型架构从单一模态输出到纵横分离查询机制训练策略从纯模仿损失到多任务协同优化| 技术代际 | 代表框架 | 输入表征 | 核心局限 | |---------------|---------------|------------|-----------------------| | 第一代(2018) | ChauffeurNet | 栅格BEV | 分辨率受限计算成本高 | | 第二代(2020) | UrbanDriver | 混合表征 | 模态间交互不足 | | 第三代(2023) | PLUTO | 纯向量化 | 长尾场景覆盖不足 |2. 架构革命向量化与纵横解耦PLUTO的突破性设计在于其参考线感知的查询机制。传统方法如PlanTF使用无锚点查询容易导致模式崩溃。PLUTO的创新体现在class LongitudinalLateralDecoder(nn.Module): def __init__(self): self.lat_queries ReferenceLineEncoder() # 基于高精地图生成 self.lon_queries nn.Parameter() # 可学习参数 self.factorized_attention MultiScaleAttention() def forward(self, scene_embedding): # 横向查询与纵向查询的笛卡尔积 combined_queries self._combine_queries() # 分解式自注意力计算 trajectories self.factorized_attention(combined_queries) return trajectories这种设计带来两个显著优势行为解耦纵向查询专注跟车、加减速等时间维度行为横向查询处理变道、绕障等空间决策可解释性每个查询对应特定驾驶语义可通过注意力权重分析决策依据3. 训练策略的三大创新3.1 可微分辅助损失传统方法如SafetyNet需要渲染整个轨迹到图像空间计算碰撞损失效率低下。PLUTO引入的插值式辅助损失实现了实时计算数千个轨迹点的ESDF欧式符号距离场支持批量处理单卡可达200FPS兼容任意向量化输出模型关键技术将车辆形状建模为覆盖圆通过双线性插值查询SDF值当距离小于安全阈值时施加二次惩罚3.2 对比模仿学习(CIL)PLUTO的CIL框架通过构造正负样本对解决了模仿学习中的因果混淆问题。其数据增强策略包括正向增强状态扰动、非交互车辆丢弃负向增强前车删除、交通灯反转、交互车辆丢弃正样本保留因果结构的场景修改负样本破坏因果关系的场景修改3.3 动态课程学习训练过程采用三阶段课程纯模仿损失快速收敛到合理策略引入辅助损失强化安全性约束加入CIL框架提升交互能力4. 闭环评估的实践智慧nuPlan基准揭示了一个反直觉现象开环指标与闭环性能的相关性仅为0.23。PLUTO的解决方案包含双层评估体系学习置信度基于轨迹似然和场景匹配度规则评分考虑舒适性、交规遵守等硬约束graph TD A[原始轨迹] -- B{安全校验} B --|通过| C[执行] B --|拒绝| D[紧急停止] C -- E[在线重规划]实际部署中这种混合架构将碰撞率降低了83%同时保持95%以上的场景不需要人工接管。5. 尚未解决的技术挑战尽管取得突破现有系统仍面临多模态预测整合单Agent预测难以处理博弈场景长尾场景覆盖极端天气、非常规交规等案例实时性瓶颈全栈模型在复杂路口延迟仍达120ms行业正在向大模型具身智能方向演进未来的自动驾驶规划系统可能需要引入世界模型进行想象推理结合强化学习进行策略微调建立可解释的决策树辅助验证从ChauffeurNet到PLUTO的五年历程证明模仿学习的天花板远比想象中更高。当算法能够真正理解为什么这样驾驶而不只是复制人类行为时自动驾驶的黎明才会真正到来。

更多文章

前端开发 2026/6/7 13:35:35

2026金三银四 Java 面试八股文合集：涵盖大厂必考的核心知识点

又逢金三银四，意味着很多人又面临着就职和跳槽，相信还有很多人对于自己就职没有很大的把我，今天就给大家分享我一个朋友总结的初、中、高级 Java 必问核心知识点，以及面试真题解答。共分类150份 PDF，累计 8340 页&am…

张开发

前端开发 2026/6/7 6:55:50

3个突破性功能：Mi-Create如何让设计爱好者实现小米设备个性化表盘创作

3个突破性功能：Mi-Create如何让设计爱好者实现小米设备个性化表盘创作【免费下载链接】Mi-Create Unofficial watchface creator for Xiaomi wearables ~2021 and above 项目地址: https://gitcode.com/gh_mirrors/mi/Mi-Create Mi-Create是一款专为小米穿戴…

张开发

前端开发 2026/6/7 13:29:27

OpenClaw怎么部署？2026年阿里云部署OpenClaw、配置百炼API、集成Skill、接入微信/钉钉/飞书/QQ指南

OpenClaw怎么部署？2026年阿里云部署OpenClaw、配置百炼API、集成Skill、接入微信/钉钉/飞书/QQ指南。OpenClaw（原Clawdbot）作为2026年主流的AI自动化助理平台，可通过阿里云轻量服务器实现724小时稳定运行，并快速接入钉…

张开发

前端开发 2026/6/6 6:08:43

UAE-Large-V1的分布式数据加载：大规模语料的高效预处理策略

UAE-Large-V1的分布式数据加载：大规模语料的高效预处理策略【免费下载链接】UAE-Large-V1 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/UAE-Large-V1 在自然语言处理领域，面对海量文本数据时，高效的数据加载与预处理是…

张开发

$PP实施经验分享（22）——(ECC版本）生产版本\BOM\工艺路线选择策略与批量大小优化实践$

前端开发 2026/6/2 6:23:50

PP实施经验分享（22）——(ECC版本）生产版本\BOM\工艺路线选择策略与批量大小优化实践

1. ECC版本下生产版本的选择逻辑在SAP ECC系统中，生产版本的选择逻辑与S4版本存在显著差异。我经历过一个汽车零部件制造项目，当时客户就遇到了生产版本选择混乱的问题。他们原先使用的是S4系统，切换到ECC后发现很多配置需要重新调整。物料…

张开发

前端开发 2026/6/5 5:16:22

Reloadium配置文件详解：如何自定义热重载行为和性能分析设置

Reloadium配置文件详解：如何自定义热重载行为和性能分析设置【免费下载链接】reloadium Hot Reloading, Profiling and AI debugging for Python 项目地址: https://gitcode.com/gh_mirrors/re/reloadium Reloadium是一个强大的Python开发工具，为…

张开发

前端开发 2026/6/7 11:17:58

【深度解析】Chrome浏览器缓存机制与优化策略

1. Chrome浏览器缓存机制揭秘第一次把Chrome装进内存盘时，那种网页秒开的畅快感让我印象深刻。但很快发现User Data\Default文件夹像吹气球一样膨胀，差点撑爆我的内存盘。这让我开始好奇：Chrome到底在本地藏了多少"小秘密"&#x…

张开发

前端开发 2026/6/5 22:46:58

iOS 15+ 设备越狱实战指南：A8-A11 芯片全流程适配方案

iOS 15 设备越狱实战指南：A8-A11 芯片全流程适配方案【免费下载链接】palera1n Jailbreak for A8 through A11, T2 devices, on iOS/iPadOS/tvOS 15.0, bridgeOS 5.0 and higher. 项目地址: https://gitcode.com/GitHub_Trending/pa/palera1n 一、问题诊断&…

张开发

前端开发 2026/5/28 10:14:19

用STM32和GP2Y1014AU0F做个空气质量检测仪（附完整代码和接线图）

基于STM32的空气质量检测仪实战开发指南最近几年，随着人们对健康生活环境的关注度不断提升，空气质量监测设备正从专业领域走向大众消费市场。作为一名嵌入式开发爱好者，我发现市面上的商用检测仪要么价格昂贵，要么功能单一&#…

张开发

前端开发 2026/6/5 9:30:11

MarkEdit：专为 macOS 设计的免费开源 Markdown 编辑器完全指南 [特殊字符]

MarkEdit：专为 macOS 设计的免费开源 Markdown 编辑器完全指南 🚀 【免费下载链接】MarkEdit Just like TextEdit on Mac but dedicated to Markdown. 项目地址: https://gitcode.com/gh_mirrors/ma/MarkEdit 想要在 macOS 上获得极致流畅的 Mark…

张开发

前端开发 2026/6/7 12:44:05

漫画翻译工具BallonsTranslator：AI辅助本地化流程全指南

漫画翻译工具BallonsTranslator：AI辅助本地化流程全指南【免费下载链接】BallonsTranslator 深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑 | Yet another computer-aided comic/manga translation tool powered by deeplearning 项目地址: http…

张开发

前端开发 2026/6/2 10:29:32

GHelper完整教程：华硕笔记本性能优化终极指南，告别Armoury Crate臃肿体验

GHelper完整教程：华硕笔记本性能优化终极指南，告别Armoury Crate臃肿体验【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Z…

张开发

从ChauffeurNet到PLUTO：模仿学习做自动驾驶规划，这5年我们踩了哪些坑？

最新文章

PAT乙级刷题避坑指南：从‘我要通过！’到‘狼人杀’，那些题目里没说清的隐藏考点

从芯片设计到客户手里：揭秘AE、FAE、PE、VE如何接力完成一颗IC的旅程

用PaddleOCR v3搞定80种语言图片文字提取：从安装到实战避坑全记录

保姆级避坑指南：在ROS Noetic上搞定aruco_ros编译与单目相机定位（解决CV_FILLED报错）

碧蓝航线Alas脚本完整指南：自动化游戏终极解决方案

FUXA工业级可视化监控系统：5天从零构建专业SCADA平台的完整指南

推荐文章

相关文章

分享文章

更多文章

2026金三银四 Java 面试八股文合集：涵盖大厂必考的核心知识点

3个突破性功能：Mi-Create如何让设计爱好者实现小米设备个性化表盘创作

OpenClaw怎么部署？2026年阿里云部署OpenClaw、配置百炼API、集成Skill、接入微信/钉钉/飞书/QQ指南

UAE-Large-V1的分布式数据加载：大规模语料的高效预处理策略

PP实施经验分享（22）——(ECC版本）生产版本\BOM\工艺路线选择策略与批量大小优化实践

Reloadium配置文件详解：如何自定义热重载行为和性能分析设置

【深度解析】Chrome浏览器缓存机制与优化策略

iOS 15+ 设备越狱实战指南：A8-A11 芯片全流程适配方案

用STM32和GP2Y1014AU0F做个空气质量检测仪（附完整代码和接线图）

MarkEdit：专为 macOS 设计的免费开源 Markdown 编辑器完全指南 [特殊字符]

漫画翻译工具BallonsTranslator：AI辅助本地化流程全指南

GHelper完整教程：华硕笔记本性能优化终极指南，告别Armoury Crate臃肿体验