人工智能智能体的喧嚣与渴望：夸夸其谈还是现实挑战？

AI快讯1年前 (2024)发布 niko

AI智能体的宣传与现实挑战并存

AI智能体作为一种先进的技术解决方案，正在成为众多科技公司和创业企业的研究热点。但现实应用中的挑战说明，仍有一段路要走。

随着大型语言模型(LLM)的持续创新，AI智能体在性能、准确度和稳定性上取得显著提高。然而，当前版本LLM的综合能力仍然无法完全支撑起AI智能体。

公共传媒空间要求AI智能体应具备多模态、多任务、多领域的能力，但现实中的具体操作效果差强人意。

WebArena排行榜为AI智能体在现实任务中的表现提供了一个真实可复现的网络环境，结果显示最高成功率仅为35.8%。

即使最著名的GPT-4模型，在现实任务的成功率中也只有14.9%。

所谓的AI智能体，尽管存在许多争议，但可以定义为具有行动能力的大型语言模型(LLM)，通常在RAG的环境中执行函数调用，以便在环境中对任务做出高层次的决策。

构建AI智能体有两大架构方法：单一智能体，以全面理解处理整个任务；多智能体系统，各子任务由更精专的智能体负责。

在AI智能体的实践中，面临种种挑战包括输出不精确、成本高、存在法律问题以及用户信任问题等。

多家初创公司正在探索AI智能体，大多数处于早期阶段，例如adept.ai、MultiOn、HypeWrite 和 minion.ai，但是多数都还停留在测试阶段。

此外，OpenAI、Google 和微软等大型科技公司也已经或即将把AI功能集成到桌面和浏览器中。

尽管AI智能体被过度炒作，但它还是有望在关键任务中发挥作用。预计未来的发展将更专注于AI增强现有工具、人机协同及合理设定期望等方面。

一个理想的前进道路可能包括：

AI智能体的时代已经来临，但它的炒作和实际应用之间还存在一定距离。这要求创业者、投资者和大型科技公司都需留存一份清醒，不要过度期待，而是应从AI增强功能的起点出发，一步一个脚印地推动技术向前发展。

文章版权归作者所有，未经允许请勿转载。