通义灵码推Qwen2.5-Max推理模型，多领域表现强劲

AI快讯1年前 (2025)发布 niko

2025年3月3日，通义灵码推出的最新推理模型Qwen2.5-Max正式上线，为开发者提供了强大的编程与数学能力支撑。Qwen2.5-Max运用了超20万亿token的预训练数据，并搭配精心规划的后训练方案，由此展现出非凡性能。

在众多基准测试里，Qwen2.5-Max表现出众。像在Arena-Hard、LiveBench、LiveCodeBench以及GPQA-Diamond等测试中，Qwen2.5-Max的成绩超越了DeepSeekV3、GPT-4o和 Claude-3.5-Sonnet等业界领先模型。在MMLU-Pro等评估中，同样展现出强劲竞争力。

在基座模型的对比环节，Qwen2.5-Max与DeepSeekV3、LLaMA-3.1-405B以及Qwen2.5-72B等模型展开全面比较。结果表明，通义千问的基座模型在多数基准测试中优势显著。

值得关注的是，三方基准测试平台Chatbot Arena公布的大模型盲测榜单中，Qwen2.5-Max力压DeepSeek-V3、Open AIo1-mini和Claude-3.5-Sonnet等模型，以1332分位居全球第七，荣膺中国非推理类大模型冠军。在数学和编程等单项能力上，Qwen2.5-Max拔得头筹，硬提示（Hardprompts）能力排名第二。ChatbotArena官方评价，阿里巴巴的Qwen2.5-Max在多个领域实力强劲，尤其在编程、数学和硬提示等专业技术领域表现突出。

目前，Qwen2.5-Max已集成至通义灵码，用户通过下载通义灵码插件，即可体验其强大的编程能力。

# AI快讯

文章版权归作者所有，未经允许请勿转载。