智谱在AI领域取得重大突破 ,于中关村论坛智谱OpenDay发布了AutoGLM沉思,这是首个带有沉思能力的桌面端agent。它能先思考再做事,且做事过程中不断思考,为用户生成充分查证和深度思考的结果报告。
技术亮点突出。AutoGLM是智谱推出的Agent产品,通过前台图形界面(GUI)实现对手机屏幕和电脑浏览器的操作,与多数基于APi的agent产品交互方式不同。而沉思能力让AI可自主解决问题,模仿深度思考。AutoGLM沉思融合了独特的GUIagent功能与沉思能力。其背后的模型基座GLM-4-Air-0414具有320亿参数量,性能对标更大参数量模型,还发布了GLM-Z1-Air推理模型,相比DeepSeek-R1推理速度提升8倍,成本降低到三十分之一,且能在消费级显卡上运行。此外,基于GLM-Z1模型训练的GLM-Z1-Rumination沉思模型,能实时联网搜索等。AutoGLM沉思的基础模型架构为中层推理和沉思模型GLM-Z1-Air、GLM-Z1-Rumination加上底层语言模型GLM-4-Air-0414,再加上工程/产品层的AutoGLM工具,形成完整技术栈。智谱还计划在4月14日全面正式开源背后所有模型。
实际应用效果与发展潜力并存。目前AutoGLM沉思处于beta测试阶段,APPSO深度使用后发现,它在处理复杂工作上有提升空间,底层逻辑需优化,但总体效果令人惊艳。在制作日本小众旅游攻略时,它能准确拆解需求、构建知识库,但存在过度依赖特定网站、实际结果未达自身要求等问题。在bRowseruse能力测试中,做科创板云计算公司研报时,“思考过程”没问题,但操作巨潮资讯网时遇到困难,还会在复杂网站设计中“受阻”。不过在简单任务中,其browseruse能力表现尚可。AutoGLM沉思虽有不足,但展现出了思考能力和一定的browseruse能力。智谱推出的“语言+推理+沉思+行动”的Agent框架,是明确可行的方向,作为国产大模型创新产品,具有独特性和创新性。