4月29日凌晨5点,备受瞩目的AI模型Qwen 3正式上线。此前从4月28日中午起,Qwen3即将发布的消息便传得沸沸扬扬,Qwen团队负责人林俊旸也在X上有所暗示,引得AI从业者们翘首以盼。在等待期间,业内讨论群里满是不知真假的Qwen3模型上传截图,从业者们不断刷新GitHub、HuggingFace中的Qwen主页,还用AI生成上线海报和模拟图,狂欢直至深夜。
成本优势与性能提升显著 。新一代的Qwen 3参数量仅为DeepSeek -R1的1/3,成本大幅下降。其基于36万亿token进行预训练,是上一代Qwen 2.5的两倍。据Qwen团队数据,仅需4张H20就能部署Qwen3满血版,显存占用仅为相近性能模型的三分之一。然而,成本降低的同时性能却大幅提高,在数学、代码生成和常识逻辑推理方面,均超越先前的QwQ和Qwen2.5模型,在基准测试中也能与o3- mini、Grok – 3和gemini – 2.5 – Pro等顶尖模型比肩。
混合推理机制与智能体适配出色 。Qwen 3搭载了Claude3.7等顶尖模型的混合推理机制,将“快思考”与“慢思考”集成进同一模型,大大减少算力消耗。它能在单一模型内无缝切换思考模式和非思考模式,其APi可按需设置“思考预算”,还能自动识别任务场景、选择思考模式,降低用户干预成本,带来更丝滑的体验。目前,热门模型中仅有Qwen3、Claude3.7以及Gemini 2.5 Flash能做到较好的混合推理。此外,Qwen3对智能体(Agents)全面适配,Qwen团队提供了包含MCP协议、Qwen – Agent框架和API服务的“保姆式”工具箱,降低开发门槛。
开源策略务实且细致 。Qwen3开源涉及8款不同架构和尺寸的模型,从0.6B到235B,适用于更多移动端设备。它延续阿里开源的慷慨风格,采用Apache2.0协议,支持119多种语言,全球开发者等可免费下载商用。阿里还细致划分各模型适用场景,如最小参数模型适用于科研实验,4B模型用于手机端等。与DeepSeekR1相比,Qwen 3旗舰版模型部署成本大幅降低,仅为满血版R1的25% – 35%。
开启开源模型新竞争周期 。在DeepSeek R1成为全球开源模型标杆后,模型发布代表着公司战略走向。2025年4月,Meta的LLaMA4发布效果不佳,Google借Gemini 2.5 pro扳回一城,而Qwen3的发布展现出更务实的开源策略,专注提高模型应用性能,拉低落地门槛。目前,通义千问Qwen全球下载量超3亿,阿里云的模型开源策略已走出清晰道路。