近年来AI大模型技术迅速发展,已经在一些专业领域取得了一定的成就,与此同时,也极大地推动了具身智能技术的进步。但是,通用AI大模型技术在具身智能场景下的使用,面对着环境适应能力上的挑战。这使得国内机器人公司意识到开发专用机器人大脑的必要性。依托哈尔滨工程大学(深圳)成立的若愚科技正是着眼于这一需求,专注于多模态大模型机器人大脑的研发,并取得了引人注目的成果。
若愚科技推出「九天」机器人大脑
若愚科技不久前推出了一款名为「九天」的机器人大脑。这款大脑利用多模态大模型驱动技术的群体智能,在无人厨房的环境中经受了实战考验。这款机器人大脑可以通过自然的人类语言与多个机器人进行互动,实现了从点菜到上菜的全过程的自主规划和操作。不再是单一的指令执行,「九天」机器人大脑可以进行自主理解人类意图、高频的人机交互和复杂的任务规划。
自然语言交互功能的实现
人机交流是基于自然语言的交互。比如当人类提出“来一份清炒生菜”的需求时,机器人不仅能自主理解人类的意图,而且可以规划出包括捡菜、称重、炒菜和上菜等多个步骤的具体任务,展现了其强大的任务规划能力。此外,「九天」还表现出一定的泛化能力,在没有特别被训练的情况下,能根据上下文理解不同的配料和佐料,例如理解蒜和辣椒都属于可替换的配料。
群体智能技术上的突破
「九天」机器人大脑的一个重要突破在于,它能够实现群体智能,赋予多个智能体之间的合作和分工。这意味着若愚科技可以实现「一个大脑控制多个身体」,使得多台机器人(包含机械臂和AGV)由若愚大脑集中管理,并且多机器人协同工作时,能够自动调整协作细节和及时响应任务变化。这种方式大大提升了工作效率,并且保证任务的安全性。在若愚科技首席产品官邓煜平的介绍中提到,机器人能自主规划任务,确保协作的安全性,这在传统的规则教示方法中很难实现。
机器人执行方面的技术优化
在控制机器人执行方面,若愚科技聚焦于小脑层面的技术优化。比如他们推出的3D可供性感知技术能够应对多样化的环境感知挑战,实现免注册、抗复杂光照和抗堆叠情况下对物体的精准抓取。面对执行复杂动作的挑战,若愚科技开发了扩散模型驱动的模仿学习技术,无需现场示教,能够精准执行复杂的技能和动作。此外,多模态大模型驱动下,若愚科技还提升了机器人臂的协作能力,大幅提高执行效率。
应用前景
国际上具身智能大脑的成果颇丰,若愚科技推出的「九天」机器人大脑的突破同样不可忽视。若愚科技联合创始人兼首席执行官孙腾博士强调,「九天」的发展不仅局限于技术验证,更可以被应用到工业、物流及商业等更为广泛的领域,如焊接、打磨、点胶、分拣、混合码垛、无人零售、无人药房、立体清洁等。这表明若愚科技公司对未来智能机器人的发展充满信心,相信「九天」能够在多个领域大放异彩。
结尾
感兴趣的读者可以通过以下视频链接(https://v.qq.com/x/page/a3551ly2qji.html)进一步了解若愚科技的「九天」机器人大脑,这一个承载了未来智能化愿景的产品,定将为相关领域的自动化发展提供强劲的动力。