OpenAI于3月12日推出一套全新工具,旨在助力Agent应用程序的开发构建,这一举动被视作在Manus压力下的应对策略。据ManusAI在社交平台X披露的消息,目前已有200万用户等待使用Manus。尽管尚未正式投放市场,Manus已然吸引了众多目光。
此前,福布斯、TechCrunch等国外媒体对Manus的报道态度各异。福布斯称Manus为“世界上第一个完全自主的人工智能代理”,甚至表示其“可以取代人类”;而TechCrunch则较为谨慎,记者KyleWiggers指出Manus未能完成点餐、预订座位及生成游戏等任务,且并非新开发的内部模型,认为其是“先于技术创新进行炒作的案例”。
随着热度攀升,海外大V也开始关注Manus。知名博主RowanCheung在社交平台X发布评测信息,博文浏览量超280万,创个人历史最高互动记录。RowanCheung将Manus的出现比作“中国的第二个DeepSeek时刻”,让其执行三项任务均顺利完成,还提到在GAIA基准上,Manus表现出色,击败了OpenAI的DeepReseARCh。
另一位科技圈博主JulianGoldie对Manus称赞有加,甚至取消了每月200美元的chatgpt订阅。他认为Manus优势明显,如能同时控制50个浏览器、实时创建和编辑文件、部署网站、执行研究迅速、生成全面报告和可视化效果等。
然而,海外测评者对Manus并非一致好评。社交平台X博主Alexander Doria测试时遇到错误信息和无限循环问题;The JacksonLaboratory教授Derya Unutmaz进行横向测试,结果显示DeepResearch在15分钟内完成任务,Manus在步骤18/20时失败,且用时50分钟。
从谷歌趋势可见,Manus过去一周全球搜索热度远低于DeepSeek,流量主要源于中国。还有博主反馈Manus在事实性问题上出错、在STEM领域协助和编程方面表现欠佳。
总体而言,对Manus的正面评价集中在复杂任务执行能力、多模态工具整合及成本优势;稳定性不足和事实性缺陷则是用户主要吐槽点。诸如JPM、GS、UBS等海外投行也对Manus予以关注,表明该产品虽未正式面世,却已在市场引发反响。不同于DeepSeek的爆火路径,Manus如今海外热度渐升,对其认知和评价也愈发理性,而其面临的挑战或许才刚刚拉开帷幕。