在红杉AI Ascent大会上,英伟达AI总监Jim Fan分享了具身智能领域发展见解。他提出了一个新的概念——物理图灵测试,即当人们无法判断是人类还是机器人完成特定物理任务时,机器人就算通过测试。目前,机器人在物理世界的表现远未达到人类水平,数据成为最大障碍。
大语言模型研究人员将互联网比作AI发展的“化石燃料”,但研究机器人的学者却没有这样的“燃料”可用。机器人需要物理交互的真实数据,这些数据只能通过遥操作 由人类手动采集,效率极低,且不具备可拓展性。
为突破这一瓶颈,Jim Fan和英伟达团队把目光投向了仿真世界。他们遵循仿真原则,以比现实快1万倍的速度进行仿真,并采用域随机化,让机器人在数字孪生中训练。例如,机器人在仿真世界中2小时的训练量相当于现实世界10年,之后可将技能迁移到真实世界。
除了数字孪生,他们还开发出“数字表亲”的仿真模式。通过3D生成、纹理生成等技术,构建RoboCasa框架,在这个平台中,除机器人本体外,视觉元素均由AI生成,可显著扩展场景和演示数据。
随着视频生成模型的发展,“仿真2.0”时代来临。视频扩散模型能生成复杂场景,通过提示词可模拟反事实情况。这种仿真虽运行速度慢,但拓展能力随计算资源呈指数级增长。将其与世界模型结合,为下一代机器人系统发展提供强大动力。
未来,物理AI之后的前沿将是“物理APi ”的革命。物理API将操控物理世界的物质变化,催生新的经济形态,如“物理AppStore”“物理提示词工程”“技能经济”等。正如黄仁勋所说,未来所有可移动的物体都将实现自主化。
© 版权声明
文章版权归作者所有,未经允许请勿转载。