谷歌发布具身智能大模型，多款机器人表现亮眼

未分类1年前 (2025)发布 niko

谷歌推陈出新，具身智能引领机器人变革

谷歌在机器人领域迈出关键一步，把推理大模型成功带入物理世界。此次发布的两款专为机器人打造的模型——gemini Robotics和GeminiRobotics-ER，均源于Gemini 2.0系列改造。

两款模型，各有千秋

Gemini Robotics作为视觉-语言-动作（VLA）模型，新增“物理动作”输出方式，可直接控制机器人。它由云端的VLA骨干网络和机器人本地芯片上运行的本地动作解码器组成，优化后延迟大幅降低。而GeminiRobotics-ER则额外增强对空间和时间的理解，解锁指向、多视图3D理解以及抓握预测等能力。

机器人技能升级，应用场景广泛

借助这两款模型，机器人成功解锁折纸、系鞋带等精细技能，灵活性也大幅提升，能根据环境变化及时改变计划，还可适应不同身体形态。这使机器人能更好地在家庭到工作场所等各种环境中与人协作。

安全保障，ASIMOV数据集保驾护航

为确保机器人安全，谷歌发布受阿西莫夫机器人三定律启发的ASIMOV数据集，用于训练机器人避免危险行为。

性能评测，ERQA基准测试显实力

在具身推理方面，谷歌推出ERQA基准测试，考察AI多种推理能力。Gemini 2.0 Pro试验版在测试中取得佳绩。

背后企业，Apptronik崭露头角

研究中的人形机器人Apollo来自机器人创业公司Apptronik。该公司出自德克萨斯大学奥斯汀分校机器人实验室，今年二月在谷歌参与的A轮融资中收获颇丰，还与梅赛德斯-奔驰展开合作。

# 未分类

文章版权归作者所有，未经允许请勿转载。