大语言模型赋能机器人,革新与挑战并存

AI快讯2周前发布 niko
4 0
AiPPT - 一键生成ppt

在全球餐厅中,常见机器人按照指令重复制作食物,如汉堡、印度薄饼等。然而,南加州大学计算机科学博士生IshikaSingh期望的是能真正“做晚饭”的机器人。这种机器人需具备走进厨房、搭配食材、烹饪菜肴和摆好餐具等能力,但传统机器人编程难以实现,症结在于经典规划流程,无法应对突发状况。

晚餐服务机器人制定“策略”时,要考虑当地饮食文化、厨房环境、服务对象情况和特殊要求,还需处理意外事件。导师JesseThomason表示,若机器人能处理日常琐事,将改写许多行业。但目前,多数工作机器人仍在严格受限环境中重复预设脚本,灵活性和应对能力无法与人类相比。

2022年chatgpt的出现带来转机,大语言模型LLMs拥有丰富人类知识,机器人则具备与环境互动的实体。将两者结合,机器人可充当语言模型的手和眼,语言模型提供高级语义知识。不过,也有人质疑LLMs,因其存在奇怪错误、偏见语言和侵犯隐私等问题。

Levatas公司的LLMs增强型机器人能理解词语含义和意图,但仅限于特定工业环境。机器人依靠有限传感器获取信息,通过计算机处理转化为机器码。机器学习则通过“神经网络”在虚拟空间运行,LLMs能生成良好预测,补足机器人的常识和背景知识。

将LLM接到机器人上是“不平衡的系统”,现实世界的随机性也给机器人带来挑战。布朗大学机器人学家StefanieTellex指出,语言理解出色,机器人表现却不佳。Thomason和Singh探索LLM应用时,需设计提示词引导LLM给出可行指令。

Singh提出ProgPrompt方法,通过示例问题提升LLM结果准确性。该方法在虚拟和实体机器人测试中表现良好。科研人员KarolHausman与Brian Ichter开发的SayCan系统,让LLM筛选满足需求的行动,展现出对高阶理解的追求。

普林斯顿大学研究人员利用LLM攻克机器人学难题,让机器人学会使用新工具,系统展现出“元学习”迹象。然而,LLM的不可控性和数据偏见引发担忧。部分机器人学家认为需限制LLM语言指令,避免危险。

在Thomason与Singh的研究中,采用混合方法,让LLM生成方案,传统AI程序执行。同时,LLMs存在数据偏见问题,忽略部分语言和文化,放大训练数据中的刻板印象。目前针对这些问题的防护措施能否跟上LLMs的发展尚不清楚。尽管如此,LLM驱动的机器人目前还未带来重大危险,技术瓶颈仍在基本操作领域。

© 版权声明
Trea - 国内首个原生AI IDE