通义灵码推Qwen2.5-Max推理模型,多领域表现强劲

AI快讯10小时前发布 niko
5 0
AiPPT - 一键生成ppt

2025年3月3日,通义灵码推出的最新推理模型Qwen2.5-Max正式上线,为开发者提供了强大的编程与数学能力支撑。Qwen2.5-Max运用了超20万亿token的预训练数据,并搭配精心规划的后训练方案,由此展现出非凡性能。

在众多基准测试里,Qwen2.5-Max表现出众。像在Arena-Hard、LiveBench、LiveCodeBench以及GPQA-Diamond等测试中,Qwen2.5-Max的成绩超越了DeepSeekV3、GPT-4o和Claude-3.5-Sonnet等业界领先模型。在MMLU-Pro等评估中,同样展现出强劲竞争力。

在基座模型的对比环节,Qwen2.5-Max与DeepSeekV3、LLaMA-3.1-405B以及Qwen2.5-72B等模型展开全面比较。结果表明,通义千问的基座模型在多数基准测试中优势显著。

值得关注的是,三方基准测试平台Chatbot Arena公布的大模型盲测榜单中,Qwen2.5-Max力压DeepSeek-V3、Open AIo1-mini和Claude-3.5-Sonnet等模型,以1332分位居全球第七,荣膺中国非推理类大模型冠军。在数学和编程等单项能力上,Qwen2.5-Max拔得头筹,硬提示(Hardprompts)能力排名第二。ChatbotArena官方评价,阿里巴巴的Qwen2.5-Max在多个领域实力强劲,尤其在编程、数学和硬提示等专业技术领域表现突出。

目前,Qwen2.5-Max已集成至通义灵码,用户通过下载通义灵码插件,即可体验其强大的编程能力。

© 版权声明
智谱清言 - 国产最强AI模型