阿里万亿参数大模型Qwen3-Max-Preview亮相:编程能力反超Claude,开源+云策略驱动后发先至

AI快讯3小时前发布 niko
3 0

阿里扔出万亿参数王炸:Qwen3-Max-Preview编程反超Claude

9月6日深夜,阿里在AI大模型赛道放出重磅信号——推出旗下史上参数规模最大的模型Qwen3-Max-Preview,参数突破1万亿,较此前千亿级模型提升近四倍。这一举措不仅刷新了阿里自身的模型规模纪录,更在全球大模型竞争中抛出了“王炸”级别的技术成果。

从官方公布的基准测试结果看,Qwen3-Max-Preview在SuperGPQA(通用推理)、AIME2025(数学推理)、LiveCodeBench V6(编程能力)等5项权威评测中,均超越Kimi K2、Claude Opus 4(Non-thinking)及DeepSeek-V3.1等竞品。其中最受关注的编程能力环节,该模型更是以“规模化扩展”的方式实现对Claude的赶超——这一结果印证了Qwen团队在X推文中的判断:“Scaling works(规模化扩展仍有效)”。

阿里万亿参数大模型Qwen3-Max-Preview亮相:编程能力反超Claude,开源+云策略驱动后发先至

实测:多场景能力验证,响应速度成亮点

目前,Qwen3-Max-Preview已开放公开体验(地址:https://chat.qwen.ai),用户可在模型下拉菜单中直接选择;阿里云同步上线了该模型的API服务(搜索“Qwen3-Max-Preview”即可访问)。

国内外开发者的实测结果已陆续流出:X平台博主AK在HuggingFace的AnyCoder项目中,输入“设计一个包含 pagoda、樱花树的voxel艺术花园场景”的Prompt,Qwen3-Max-Preview一次性生成了完整的代码与场景效果;在官网测试“为Qwen3 Max发布设计庆祝 landing page”时,模型仅用3秒就输出了包含布局、配色的完整页面,响应速度得到用户一致好评。

阿里万亿参数大模型Qwen3-Max-Preview亮相:编程能力反超Claude,开源+云策略驱动后发先至

针对复杂编程任务,测试“用JavaScript实现弹跳球在旋转六边形内的物理模拟”时,模型生成的代码可精准还原小球的重力、摩擦力反馈;即使将球的数量增加至10个,运动轨迹仍保持流畅。不过,当Prompt过于简单(如“制作《愤怒的小鸟》小游戏”)时,生成结果存在怪物位置偏移等小瑕疵,需通过优化Prompt细节解决。

后发先至的底层逻辑:开源生态与“模+云”的双轮驱动

在AI大模型竞赛中,阿里并非最早入场的玩家,但凭借“开源构建生态+自研探索前沿”的策略,实现了“后发先至”:

  • 开源:用开发者生态换场景数据。自2023年起,Qwen持续向全球开源70亿、140亿、720亿等多版本模型,覆盖文本、视觉、音频等多模态场景;不仅开放模型权重,更提供商业化授权,激发中小企业与个人开发者的创新热情。这一策略让Qwen在Hugging Face社区快速积累了超10万星标,形成“开发者贡献场景数据-模型迭代优化”的正向循环——这是闭源模型难以复制的优势。
  • “模+云”:缩短技术到商业的路径。阿里云为Qwen提供了超大规模计算集群、分布式训练算法等基础设施,解决了万亿参数模型的训练稳定性问题;同时,通过MaaS(模型即服务)战略,企业客户可直接调用Qwen API或微调开源模型,快速将AI能力融入业务。这种“模型技术+云计算”的协同,让Qwen的技术突破能快速转化为商业化价值。

挑战在前:开源的商业考验与人才壁垒

尽管Qwen已跻身全球第一梯队,但仍需跨越两大障碍:

  • 开源与收益的平衡。开源策略虽能快速普及技术,但企业若能免费获取性能足够的开源模型,付费使用阿里云服务的意愿可能降低。阿里云需通过“性能优化+企业级安全+工具链”构建护城河——比如为付费客户提供“比开源版本快30%的推理速度”“7×24小时技术支持”等增值服务,将开源用户转化为高价值客户。
  • 顶尖人才的保留与吸引。近年来,包括AI框架专家贾扬清在内的核心人才离开阿里,虽未动摇根基,但可能影响团队的战略延续性。在AI人才薪资水涨船高的背景下,阿里需通过“技术愿景+股权激励+研发资源”保持对顶尖人才的吸引力——毕竟,大模型的竞争最终是人才的竞争。

结语:从“参数突破”到“生态赢局”,Qwen的长跑才刚开始

Qwen3-Max-Preview的推出,标志着阿里在大模型的“参数规模”与“核心能力”上已达到全球顶尖水平。其“开源+闭源并行”“模+云协同”的策略,为后发企业提供了一条可借鉴的路径——但要维持优势,Qwen需在商业化模式上持续探索,同时解决人才与生态的长期问题。

正如AI行业的共识:大模型的竞争不是“一次性的技术突破”,而是“长期的生态与商业能力比拼”。Qwen的万亿参数王炸,只是这场长跑中的一个里程碑;未来能否将技术优势转化为市场胜势,才是真正的考验。

本文来自微信公众号“划重点KeyPoints”,作者:林易,36氪经授权发布。

© 版权声明
Trea - 国内首个原生AI IDE