具身智能时代:人形机器人数据采集难题与解决之道

AI快讯3天前发布 niko
13 0
AiPPT - 一键生成ppt

步入2025年,机器人在晚会上转手绢虽能引发欢呼,但距离人们儿时科普读物中如阿童木般的机器人仍有差距。让机器人完成拖地、遛狗等日常事务,目前还难以实现。其发展受限的关键在于数据获取。

具身智能概念兴起 :半个世纪前,人形机器人已具雏形,如日本早稻田大学1973年研制的Wabot -1,但长期未实现从“自动化”到“智能化”的质变。深度学习和AI大模型推动下,“具身智能”受广泛关注。它基于物理身体感知和行动,展现形态多样,包括人形、四足、轮式机器人等,甚至涵盖智能驾驶。与DeepSeekchatgpt等不同,具身智能需与“物理实体”交互,理解真实世界。

数据采集是关键难题:机器人学习始于数据采集和处理,但其需获取的图像、空间、运动等多维度数据,生成和采集难度远超互联网数据,导致具身智能可用数据集小。缺乏数据成为具身智能能力突破的重要壁垒,真实数据获取成本高,仿真合成数据存在“现实差距”。

真实世界数据采集方式:真实世界数据采集主要有人动作捕捉和人类遥操作。动作捕捉有光学和惯性两种模式,光学捕捉精度高但对场地和光线要求高,惯性捕捉不受场地限制,受不少人形机器人厂商青睐。不过,人类与机器人动作轨迹存在适配问题,人类遥操作可解决这一问题,采集真机数据,弥合“具身差距”。但真机采集模式成本高昂,如特斯拉Optimus数据采集可能需5亿美元。

仿真世界数据采集优势:仿真世界数据采集可降低成本,解决机器人“泛化能力”问题。仿真平台能模拟各种环境和机器人行为,完成Real2Sim2Real过程,但“仿真与现实的鸿沟”仍待解决。此外,互联网数据虽量大,但“噪声”大、随机性强,难以直接用于训练,不过研究机构正尝试用其进行“预训练”。未来,互联网数据、仿真数据和真机数据有望融合,“脑机接口”也可能成为重要数据来源。

© 版权声明
Trea - 国内首个原生AI IDE