具身智能发展:开源数据集与多形式训练推动突破

AI快讯4周前发布 niko
10 0
AiPPT - 一键生成ppt

具身智能的发展正处于关键阶段,如同曾经的AI,人形机器人过去50多年发展缓慢,而具身智能也亟待突破,其中数据是关键因素。

开源数据集为具身智能发展汇聚力量 。2023年10月,谷歌DeepMind联合21个机构收集22个不同类型机器人数据,开源了OpenX-Embodiment数据集,并训练了通用机器人模型RT-X。不过,该数据集由60个已有机器人数据集构建,存在数据参差不齐的问题。随后,众多机构纷纷开源具身智能数据集。2024年8月,鹏城实验室等发布并开源了ARIO,其在数据统一、质量、规模和场景丰富度上有显著提升。同年,国地共建具身智能机器人创新中心联合相关机构发布了RoboMIND。2024年12月,智元机器人发布AgiBotWorld,数据源于真机操作,具有高数据质量和统一性,且场景范围广泛。2025年2月,智元机器人又开源了AgiBot DigitalWorld仿真数据集。宇树机器人也开源了其G1机器人操作数据集。不过,像波士顿动力的Atlas和特斯拉的Optimus等数据未公开。

真机训练是具身智能数据获取的重要途径。人形机器人真机训练主要依靠人类动作捕捉和遥操作,相关服务商不断涌现。诺亦腾原本业务集中在多个领域,2023年下半年起,机器人领域合作激增。在机器人遥操作中,需优化算法减少“Sim2RealGap”。例如,诺亦腾和智元机器人优化惯性动作捕捉算法,凌云光与宇数科技研发光学动作捕捉系统FZMotion。此外,还有局部数据采集遥操作解决方案服务商,以及数据质检、标注、存储等服务商,共同构成真机数据采集生态链。部分机器人本体厂商搭建大型真机训练场,如智元机器人搭建全球最大的机器人数据生产与采集工厂。国家和地方政府也参与其中,上海的国地中心建设的“异构人形机器人训练场”已投入使用,其目的是让AI建立客观认知,预计2025年收集1000万条高质量机器人实体数据。

仿真训练拓展具身智能现实边界 。真机数据采集成本高且难解决“泛化”问题,因此仿真数据采集和训练解决方案受到关注。智元科技的AgiBotDigitalWorld是一套开源仿真框架。群核科技的酷家乐在装修领域积累的模型数据,成为人形机器人训练的优质资源,其平台有3.6亿个3D仿真物品模型,能保证物理正确。英伟达推出的世界模型Cosmos,可生成高度仿真的虚拟世界,让机器人在虚拟世界完成任务并获得反馈。OpenAI的Sora也曾被定义为“世界模型”,相关领域受到广泛关注。

© 版权声明
Trea - 国内首个原生AI IDE