谷歌发布具身智能大模型,多款机器人表现亮眼

未分类2个月前发布 niko
18 0
AiPPT - 一键生成ppt

谷歌推陈出新,具身智能引领机器人变革

谷歌在机器人领域迈出关键一步,把推理大模型成功带入物理世界。此次发布的两款专为机器人打造的模型——gemini Robotics和GeminiRobotics-ER,均源于Gemini 2.0系列改造。

两款模型,各有千秋

Gemini Robotics作为视觉-语言-动作 (VLA)模型,新增“物理动作”输出方式,可直接控制机器人。它由云端的VLA骨干网络和机器人本地芯片上运行的本地动作解码器组成,优化后延迟大幅降低。而GeminiRobotics-ER则额外增强对空间和时间的理解,解锁指向、多视图3D理解以及抓握预测等能力。

机器人技能升级,应用场景广泛

借助这两款模型,机器人成功解锁折纸、系鞋带等精细技能,灵活性也大幅提升,能根据环境变化及时改变计划,还可适应不同身体形态。这使机器人能更好地在家庭到工作场所等各种环境中与人协作。

安全保障,ASIMOV数据集保驾护航

为确保机器人安全,谷歌发布受阿西莫夫机器人三定律启发的ASIMOV数据集,用于训练机器人避免危险行为。

性能评测,ERQA基准测试显实力

在具身推理方面,谷歌推出ERQA基准测试,考察AI多种推理能力。Gemini 2.0 Pro试验版在测试中取得佳绩。

背后企业,Apptronik崭露头角

研究中的人形机器人Apollo来自机器人创业公司Apptronik。该公司出自德克萨斯大学奥斯汀分校机器人实验室,今年二月在谷歌参与的A轮融资中收获颇丰,还与梅赛德斯-奔驰展开合作。

© 版权声明
Trea - 国内首个原生AI IDE