跨维智能：3D视觉导航技术领先企业完成战略轮融资

AI快讯2年前 (2024)更新 niko

近日，一家专注于3D生成式AI和多模态大模型的具身智能技术公司——跨维智能，宣布完成了由联想创投领投的战略轮融资。公司表示，所筹资金将主要用于产品研发、团队扩充和市场拓展。

跨维智能成立于2021年6月，致力于为下游企业客户提供软硬一体的具身智能解决方案，依托于3D生成式AI、多模态大模型和三维成像技术等，该公司在视觉感知领域取得了显著进展。公司创始人贾奎，是香港中文大学（深圳）的教授，拥有丰富的学术背景和深厚的行业经验。

贾奎教授在人工智能、计算机视觉、机器学习等领域进行了长期研究，并曾在香港中文大学、中科院深圳先进技术研究院等机构参与教学与科研工作。自2018年起，他在华南理工大学“几何感知与智能”实验室推动了以Sim2Real技术为核心的研究，该技术后成为公司的核心优势。

据贾奎教授介绍，具身智能的发展可分为五个阶段，从L1至L5，逐步实现从特定环境到任意或未知场景的自适应通用机器人形态，完成多样化任务。他强调，高质量标注数据的稀缺性是具身智能发展的主要瓶颈。相比之下，语言模型和二维图像、视频模型，具身智能底层模型需要在物理世界的绝对坐标系下进行海量精确测量数据的训练，其数据获取难度和成本远超其他类型模型。

为了解决这一问题，跨维智能采用了一种创新的方法——合成数据代替真实物理数据。其核心的Sim2Real技术，通过在物理仿真环境中引入现实世界干扰，辅以渲染手段，生成大量精确标注的合成数据，这些数据随后用于大模型的训练。这一技术为企业提供了一种高效、低成本且真实可靠的解决方案。

跨维智能的Sim2Real技术已被应用到工业制造等多个领域。去年5月，公司发布了Xema北极鸥系列相机，并开源了API接口和SDK二次开发软件包，以降低用户的二次开发和适配成本。此外，公司还针对机械设备的3D视觉模型训练，提供了基于100%合成数据的训练模型，这一模型能够实现超过99.9%的稳定操作或抓取能力。

公司未来的技术发展规划分为三个阶段：首先是数据与具身智能仿真引擎DexVerse™的开发；其次是基于3D VLA（3D Vision Language Action）大模型的成像感知套件的推出；最终目标是发展具有强泛化性的通用具身智能大模型。

联想创投在评价跨维智能时表示，公司所拥有的Sim2Real和大模型相关技术，在实现高通用性的具身智能领域中发挥着核心作用，其软、硬件产品矩阵展现出深厚的商业化潜力。

# AI快讯

文章版权归作者所有，未经允许请勿转载。