谷歌新 AI 模型赋能机器人:仪器读取准确率从 23%飙升至 98%!

张开发
2026/4/17 8:00:56 15 分钟阅读

分享文章

谷歌新 AI 模型赋能机器人:仪器读取准确率从 23%飙升至 98%!
【导语谷歌 DeepMind 推出全新 Gemini Robotics-ER 1.6 模型与波士顿动力合作提升机器人“具身推理”能力使机器人在工业设施检查中有更出色表现。】新模型赋予机器人多维度能力谷歌 DeepMind 于 4 月 14 日发布的 Gemini Robotics-ER 1.6 模型可作为机器人的“高级推理模型”能规划并执行任务。它赋予了机器人准确读取复杂仪表数据以及通过视镜进行视觉检查的能力。波士顿动力的 Spot 机器人就借助该模型在工业设施中巡逻时进行检查工作。主动视觉能力大幅提升表现主动视觉能力早在 2026 年 1 月发布的谷歌 Gemini 3.0 Flash 模型中就已引入此次在新模型中发挥了重要作用。它将视觉推理与执行代码的能力相结合创建“视觉暂存区”。这一能力将机器人在仪器读取任务上的表现从旧版 Gemini Robotics-ER 1.5 模型的23%提升到了新版的98%。相比之下Gemini 3.0 Flash 模型的准确率仅为67%。即使没有主动视觉能力Gemini Robotics-ER 1.6 基准模型在读取仪器数据时仍能达到86%的准确率。它采用指向视觉图像中不同元素的处理方式完成复杂任务还具备更出色的“多视角推理”能力能利用多个摄像头的数据流理解周围环境。合作推动工业机器人发展谷歌 DeepMind 与波士顿动力的持续合作让机器人在工业设施中的应用得到了进一步拓展。波士顿动力热衷于在各类工业设施中测试机器人其 Spot 机器人作为检查员在工厂和仓库中发挥着重要作用。这种合作模式有望推动工业机器人在更多领域的应用和发展。编辑观点谷歌新模型显著提升机器人能力与波士顿动力的合作也为工业机器人发展带来新契机未来有望在工业领域发挥更大作用。

更多文章