阿里Qwen3新模型发布,聚焦推理能力与影响力考核

AI快讯5小时前发布 niko
0 0
AiPPT - 一键生成ppt

阿里新模型Qwen3发布计划浮出水面。虎嗅独家了解到,2025年4月第二周,阿里将推出新模型Qwen3,这是其2025年上半年关键的模型产品。自2024年9月云栖大会发布Qwen2.5后,约七个月的时间迎来新突破。

模型推理能力成为关键发展方向。2024年发布Qwen2.5后,阿里云基础模型团队就已着手Qwen3项目。然而,2025年初DeepSeek的火爆改变了策略重心。知情人士透露,此前模型推理能力虽受关注但非首要方向,DeepSeek-R1发布后,其成为关键能力,阿里云团队策略向此倾斜。

对标模型转变与影响力考核。2024年下半年,阿里云团队对标OpenAI的o1,如今DeepSeek-R1也成为主要对标模型。在阿里内部,基础模型团队考核重点是“模型影响力”。高层期望塑造“最强模型”心智,集团CEO吴泳铭密切关注业务进展。

考核维度明确:衍生模型与社区人气。衍生模型量和在开发者社区的受欢迎度是两个重要考核点。阿里采取开源策略,基于Qwen的衍生模型超10万,2024年Qwen系列模型下载量超2亿,这两个维度反映了模型在开发者社区的影响力。

多尺寸策略与人才新需求 。2025年,阿里模型团队瞄准智驾、AIAgent、AI硬件等风口,将继续采用“多尺寸”策略,Qwen3尺寸类型可能更多。同时,伴随Qwen3发布,阿里开启大规模校招,基础模型团队招聘更看重“AI原生”人才,而非传统NLP人才。

© 版权声明
Trea - 国内首个原生AI IDE