大语言模型赋能机器人，革新与挑战并存

AI快讯1年前 (2025)发布 niko

在全球餐厅中，常见机器人按照指令重复制作食物，如汉堡、印度薄饼等。然而，南加州大学计算机科学博士生IshikaSingh期望的是能真正“做晚饭”的机器人。这种机器人需具备走进厨房、搭配食材、烹饪菜肴和摆好餐具等能力，但传统机器人编程难以实现，症结在于经典规划流程，无法应对突发状况。

晚餐服务机器人制定“策略”时，要考虑当地饮食文化、厨房环境、服务对象情况和特殊要求，还需处理意外事件。导师JesseThomason表示，若机器人能处理日常琐事，将改写许多行业。但目前，多数工作机器人仍在严格受限环境中重复预设脚本，灵活性和应对能力无法与人类相比。

2022年 chatgpt的出现带来转机，大语言模型LLMs拥有丰富人类知识，机器人则具备与环境互动的实体。将两者结合，机器人可充当语言模型的手和眼，语言模型提供高级语义知识。不过，也有人质疑LLMs，因其存在奇怪错误、偏见语言和侵犯隐私等问题。

Levatas公司的LLMs增强型机器人能理解词语含义和意图，但仅限于特定工业环境。机器人依靠有限传感器获取信息，通过计算机处理转化为机器码。机器学习则通过“神经网络”在虚拟空间运行，LLMs能生成良好预测，补足机器人的常识和背景知识。

将LLM接到机器人上是“不平衡的系统”，现实世界的随机性也给机器人带来挑战。布朗大学机器人学家StefanieTellex指出，语言理解出色，机器人表现却不佳。Thomason和Singh探索LLM应用时，需设计提示词引导LLM给出可行指令。

Singh提出ProgPrompt方法，通过示例问题提升LLM结果准确性。该方法在虚拟和实体机器人测试中表现良好。科研人员KarolHausman与Brian Ichter开发的SayCan系统，让LLM筛选满足需求的行动，展现出对高阶理解的追求。

普林斯顿大学研究人员利用LLM攻克机器人学难题，让机器人学会使用新工具，系统展现出“元学习”迹象。然而，LLM的不可控性和数据偏见引发担忧。部分机器人学家认为需限制LLM语言指令，避免危险。

在Thomason与Singh的研究中，采用混合方法，让LLM生成方案，传统AI程序执行。同时，LLMs存在数据偏见问题，忽略部分语言和文化，放大训练数据中的刻板印象。目前针对这些问题的防护措施能否跟上LLMs的发展尚不清楚。尽管如此，LLM驱动的机器人目前还未带来重大危险，技术瓶颈仍在基本操作领域。

# AI快讯

文章版权归作者所有，未经允许请勿转载。