具身智能浪潮下:Transformer架构与机器人数据的新突破

AI快讯10小时前发布 niko
4 0
AiPPT - 一键生成ppt

具身智能当下仍处发展的“乱世”阶段。赛源作为特斯拉、英伟达等在人形机器人领域的合作商,其创始人殷鹏认为,真实物理交互数据是具身智能军备竞赛的核心弹药。

Transformer架构给机器人行业带来了质的飞跃。它最早由谷歌提出,后被特斯拉用于自动驾驶。该架构实现了空间理解能力的质变,取得泛化能力的突破,推动了从规则驱动到数据驱动的范式转变。其在空间理解、泛化能力和学习范式上的提升,让机器人从“专用AI”向“通用AI”转变,为具身智能热潮奠定了基础。

全球机器人模型主要分为两类。“世界模型”如李飞飞实验室的OpenVRA1.0和谷歌的PaLM,收敛速度快,但泛化能力弱,适合简单场景演示。分层混合架构模型,像Figure.AI,分工明确,适用于复杂、动态且对操作精度要求高的场景。

在数据方面,机器人数据可能是具身智能中最快完成商业闭环的。赛源专注于真实场景数据的采集,与其他公司不同,它不仅做数据标注,还进行数据采集和验证。通过开源社区和内部训练验证,赛源收集了上百万小时的真实数据。

殷鹏作为赛源CEO,也是香港城市大学助理教授,他有着丰富的学术和科研经历。他师从JiZhang教授,参与过NASA、DARPA和英伟达的课题。他选择创业是因为学术资源无法满足需求,他希望亲自挖掘行业核心难题。

创业过程中,殷鹏面临诸多挑战。从科学家到创业者,他需要从“钉子”思维转变为“梳子”思维,兼顾全局。商业模式的不确定性也增加了决策难度,但他凭借第一性原理分析和快速反馈来应对。

具身智能行业前景广阔,但也充满竞争。随着越来越多公司涌入,找到独特位置至关重要。赛源将继续专注于数据核心,为具身智能发展贡献力量。

© 版权声明
Trea - 国内首个原生AI IDE