AutoGLM沉思：融合多种能力的创新型AI产品

AI快讯1年前 (2025)发布 niko

智谱在AI领域取得重大突破 ，于中关村论坛智谱OpenDay发布了AutoGLM沉思，这是首个带有沉思能力的桌面端agent。它能先思考再做事，且做事过程中不断思考，为用户生成充分查证和深度思考的结果报告。

技术亮点突出。AutoGLM是智谱推出的Agent产品，通过前台图形界面（GUI）实现对手机屏幕和电脑浏览器的操作，与多数基于APi的agent产品交互方式不同。而沉思能力让AI可自主解决问题，模仿深度思考。AutoGLM沉思融合了独特的GUIagent功能与沉思能力。其背后的模型基座GLM-4-Air-0414具有320亿参数量，性能对标更大参数量模型，还发布了GLM-Z1-Air推理模型，相比DeepSeek-R1推理速度提升8倍，成本降低到三十分之一，且能在消费级显卡上运行。此外，基于GLM-Z1模型训练的GLM-Z1-Rumination沉思模型，能实时联网搜索等。AutoGLM沉思的基础模型架构为中层推理和沉思模型GLM-Z1-Air、GLM-Z1-Rumination加上底层语言模型GLM-4-Air-0414，再加上工程/产品层的AutoGLM工具，形成完整技术栈。智谱还计划在4月14日全面正式开源背后所有模型。

实际应用效果与发展潜力并存。目前AutoGLM沉思处于beta测试阶段，APPSO深度使用后发现，它在处理复杂工作上有提升空间，底层逻辑需优化，但总体效果令人惊艳。在制作日本小众旅游攻略时，它能准确拆解需求、构建知识库，但存在过度依赖特定网站、实际结果未达自身要求等问题。在bRowseruse能力测试中，做科创板云计算公司研报时，“思考过程”没问题，但操作巨潮资讯网时遇到困难，还会在复杂网站设计中“受阻”。不过在简单任务中，其browseruse能力表现尚可。AutoGLM沉思虽有不足，但展现出了思考能力和一定的browseruse能力。智谱推出的“语言+推理+沉思+行动”的Agent框架，是明确可行的方向，作为国产大模型创新产品，具有独特性和创新性。

# AI快讯

文章版权归作者所有，未经允许请勿转载。