近日,在人形机器人领域掀起了新的热潮。智元机器人于3月11日推出基于GO-1具身智能大模型的灵犀X2,这一新品展示出如行走、小跑、骑自行车等丰富多样的生动行为,引发广泛关注。
深入探究人形机器人发展,了解其运动原理至关重要。机器人运动可分解为本体运动与肢体运动,而肢体运动又能细化为旋转运动和直线运动,且直线运动可通过旋转运动实现。达成这些旋转运动依靠电机,其中大扭矩起着关键作用。大扭矩让机械臂能施加更强的力,用于举起重物、保持稳定、进行精密操作,尤其对人形机器人行走、爬坡等运动意义重大,能帮助其克服多种阻力确保稳定。
有了大扭矩这一基础,平衡术成为另一关键要素。本体运动通过肢体运动与环境交互实现质心的平移、旋转,从而达成行走等目的。在机器人动力学中,常将人形机器人简化为线性倒立摆模型,即LIPM模型。围绕零力矩点(ZMP)计算可确保机器人不摔倒,通过这个模型可将行走转化为方程求解。不过,LIPM模型较为理想,实际运动中机器人需规划参考ZMP路线,保持实际ZMP与参考ZMP重合来维持平衡,并确保ZMP点位于支撑多边形内。
为让机器人学会走路、做动作,强化学习是常用方法。机器人在行走时根据正确或错误的步伐获得奖励或惩罚,从而强化或弱化当前行为。但强化学习存在动作空间大、资源消耗大以及可能出现“rewardhacking”现象等缺点。随着人形机器人自由度增加,错误行为概率增大,于是模仿学习应运而生。模仿学习让机器人通过观察学习,缩小了动作空间,避免无效探索,但也存在问题,如Agent只模仿动作不管结果,在现实实操中易出错,为此人们尝试了交互式模仿学习等解决方法。
智元机器人在这方面进行了探索,创建了AgiBot World百万级机器人真机实操数据集,以及AgiBot DigitalWorld更大规模的机器人虚拟仿真框架和开源数据集。后者在保持数据模态丰富的同时,引入大量随机因素,帮助机器人学习区分相关与不相关因素。然而,虚拟与现实存在差距,知识共享成为弥合差距的关键。通过共享神经网络中间层的表征空间,可实现知识技能迁移,不同领域的数据和机器人技能都能借此融合。
在智元机器人GO-1具身智能大模型中,视觉大语言模型识别视觉输入后调用行动规划专家和动作专家生成下一步动作,核心在于知识共享和复用。模仿学习结合超大数据集为机器人发展带来潜力,大模型的突破很可能推动人形机器人取得突破,AI正为机器人赋予灵魂。