近期,中美大模型公司动作不断,在行业内掀起波澜。4月15日凌晨,OpenAI推出GPT-4.1系列模型,涵盖GPT-4.1、GPT-4.1Mini、GPT-4.1 Nano。这些模型以成本更低、速度更快为显著特征,其中GPT-4.1Mini在多个基准测试中超越GPT-4o,成本降低83%;GPT-4.1 Nano作为首个超小型模型,支持100万token的上下文窗口,适用于低延迟任务。
同一天,中国明星AI公司智谱ai正式启动上市辅导备案,由中金公司担任辅导机构,计划于今年8月至10月完成IPO辅导计划 。此前,智谱AICEO张鹏曾表示实现AGI尚需时日,如今看来,IPO或为获取“更多盘缠”的途径。
2025年开年,DeepSeek凭借R1模型“燃爆”AI圈。从其更新节奏来看,与国外主流公司相近,几乎每隔3个月就有一次升级。有预测称,DeepSeek下一次更新R1模型可能在5月初,不过官方尚未回应。在R1模型走红后,DeepSeek不仅在模型升级上发力,3月还发布多个重要岗位招聘信息,引发融资猜测。
在成本与价格方面,OpenAI此次推出的模型与DeepSeek形成对标,打起token价格战。例如,GPT‑4.1比GPT‑4o便宜26%,GPT‑4.1Nano输入、输出成本更低。而DeepSeek的V3模型和R1推理也有相应的费用标准。此外,OpenAI暂停了高成本的GPT-4.5,并表示将推出更好的开源模型。
除OpenAI外,谷歌在4月9日举办发布会,推出Agent2Agent智能体交互协议,该协议可实现AI智能体底层技术无关的相互操作,有望提高自主性、降低成本。
值得关注的是,在人事与模型发展之外,DeepSeek面临着外部挑战。英伟达称美国政府限制H20芯片向中国出口,而H20芯片正是梁文锋团队重视的“基础设施”。此前梁文锋就曾表示,高端芯片出口禁令是团队面临的挑战,但他也强调重建团队、追赶下一代技术才是关键。