2025年3月3日,通义灵码推出的最新推理模型Qwen2.5-Max正式上线,为开发者提供了强大的编程与数学能力支撑。Qwen2.5-Max运用了超20万亿token的预训练数据,并搭配精心规划的后训练方案,由此展现出非凡性能。
在众多基准测试里,Qwen2.5-Max表现出众。像在Arena-Hard、LiveBench、LiveCodeBench以及GPQA-Diamond等测试中,Qwen2.5-Max的成绩超越了DeepSeekV3、GPT-4o和Claude-3.5-Sonnet等业界领先模型。在MMLU-Pro等评估中,同样展现出强劲竞争力。
在基座模型的对比环节,Qwen2.5-Max与DeepSeekV3、LLaMA-3.1-405B以及Qwen2.5-72B等模型展开全面比较。结果表明,通义千问的基座模型在多数基准测试中优势显著。
值得关注的是,三方基准测试平台Chatbot Arena公布的大模型盲测榜单中,Qwen2.5-Max力压DeepSeek-V3、Open AIo1-mini和Claude-3.5-Sonnet等模型,以1332分位居全球第七,荣膺中国非推理类大模型冠军。在数学和编程等单项能力上,Qwen2.5-Max拔得头筹,硬提示(Hardprompts)能力排名第二。ChatbotArena官方评价,阿里巴巴的Qwen2.5-Max在多个领域实力强劲,尤其在编程、数学和硬提示等专业技术领域表现突出。
目前,Qwen2.5-Max已集成至通义灵码,用户通过下载通义灵码插件,即可体验其强大的编程能力。
© 版权声明
文章版权归作者所有,未经允许请勿转载。