Qwen 3发布：成本大降性能跃升，引领开源模型新竞争

AI快讯1年前 (2025)发布 niko

4月29日凌晨5点，备受瞩目的AI模型Qwen 3正式上线。此前从4月28日中午起，Qwen3即将发布的消息便传得沸沸扬扬，Qwen团队负责人林俊旸也在X上有所暗示，引得AI从业者们翘首以盼。在等待期间，业内讨论群里满是不知真假的Qwen3模型上传截图，从业者们不断刷新GitHub、HuggingFace中的Qwen主页，还用AI生成上线海报和模拟图，狂欢直至深夜。

成本优势与性能提升显著 。新一代的Qwen 3参数量仅为DeepSeek -R1的1/3，成本大幅下降。其基于36万亿token进行预训练，是上一代Qwen 2.5的两倍。据Qwen团队数据，仅需4张H20就能部署Qwen3满血版，显存占用仅为相近性能模型的三分之一。然而，成本降低的同时性能却大幅提高，在数学、代码生成和常识逻辑推理方面，均超越先前的QwQ和Qwen2.5模型，在基准测试中也能与o3- mini、Grok – 3和gemini – 2.5 – Pro等顶尖模型比肩。

混合推理机制与智能体适配出色 。Qwen 3搭载了Claude3.7等顶尖模型的混合推理机制，将“快思考”与“慢思考”集成进同一模型，大大减少算力消耗。它能在单一模型内无缝切换思考模式和非思考模式，其APi可按需设置“思考预算”，还能自动识别任务场景、选择思考模式，降低用户干预成本，带来更丝滑的体验。目前，热门模型中仅有Qwen3、Claude3.7以及Gemini 2.5 Flash能做到较好的混合推理。此外，Qwen3对智能体（Agents）全面适配，Qwen团队提供了包含MCP协议、Qwen – Agent框架和API服务的“保姆式”工具箱，降低开发门槛。

开源策略务实且细致 。Qwen3开源涉及8款不同架构和尺寸的模型，从0.6B到235B，适用于更多移动端设备。它延续阿里开源的慷慨风格，采用Apache2.0协议，支持119多种语言，全球开发者等可免费下载商用。阿里还细致划分各模型适用场景，如最小参数模型适用于科研实验，4B模型用于手机端等。与DeepSeekR1相比，Qwen 3旗舰版模型部署成本大幅降低，仅为满血版R1的25% – 35%。

开启开源模型新竞争周期 。在DeepSeek R1成为全球开源模型标杆后，模型发布代表着公司战略走向。2025年4月，Meta的LLaMA4发布效果不佳，Google借Gemini 2.5 pro扳回一城，而Qwen3的发布展现出更务实的开源策略，专注提高模型应用性能，拉低落地门槛。目前，通义千问Qwen全球下载量超3亿，阿里云的模型开源策略已走出清晰道路。

# AI快讯

文章版权归作者所有，未经允许请勿转载。