仿真2.0时代：世界模型与物理API推动机器人突破物理图灵测试

在红杉AI Ascent大会上，英伟达AI总监Jim Fan分享了具身智能领域发展见解。他提出了一个新的概念——物理图灵测试，即当人们无法判断是人类还是机器人完成特定物理任务时，机器人就算通过测试。目前，机器人在物理世界的表现远未达到人类水平，数据成为最大障碍。

大语言模型研究人员将互联网比作AI发展的“化石燃料”，但研究机器人的学者却没有这样的“燃料”可用。机器人需要物理交互的真实数据，这些数据只能通过遥操作 由人类手动采集，效率极低，且不具备可拓展性。

为突破这一瓶颈，Jim Fan和英伟达团队把目光投向了仿真世界。他们遵循仿真原则，以比现实快1万倍的速度进行仿真，并采用域随机化，让机器人在数字孪生中训练。例如，机器人在仿真世界中2小时的训练量相当于现实世界10年，之后可将技能迁移到真实世界。

除了数字孪生，他们还开发出“数字表亲”的仿真模式。通过3D生成、纹理生成等技术，构建RoboCasa框架，在这个平台中，除机器人本体外，视觉元素均由AI生成，可显著扩展场景和演示数据。

随着视频生成模型的发展，“仿真2.0”时代来临。视频扩散模型能生成复杂场景，通过提示词可模拟反事实情况。这种仿真虽运行速度慢，但拓展能力随计算资源呈指数级增长。将其与世界模型结合，为下一代机器人系统发展提供强大动力。

未来，物理AI之后的前沿将是“物理APi ”的革命。物理API将操控物理世界的物质变化，催生新的经济形态，如“物理AppStore”“物理提示词工程”“技能经济”等。正如黄仁勋所说，未来所有可移动的物体都将实现自主化。

文章版权归作者所有，未经允许请勿转载。