谷歌Gemini 2.5 Pro发布：编程能力突出，多方面表现优异

AI快讯1年前 (2025)发布 niko

gemini 2.5 Pro震撼发布 ：3月26日，谷歌推出Gemini 2.5思考模型家族首个成员——Gemini 2.5Pro实验版本。此版本一经亮相便在大模型竞技场大放异彩，以1443分的成绩、39分的优势获得断层第一，全面超越OpenAI o3 – mini等众多模型。

性能表现有优有劣 ：Gemini 2.5 Pro在多项基准测试中领先，但谷歌未公布其与OpenAI部分模型对比情况。在智能体编程评估基准SWE -bench verified上，得分低于Claude 3.7 Sonnet。不过在常见编程、数学和科学基准测试，包括难度超高的Humanity’s LastExam中处于领先，得分提升明显。目前支持100万tokens上下文窗口，不久将拓展至200万tokens。

编程能力亮点突出：谷歌DeepMind展示多个演示视频，体现其编程与多领域能力结合。如探索曼德博集合、创建互动式图表、开发游戏等，展示了该模型在数学、可视化和审美等方面的能力。

多方面能力提升：在需要高级推理能力的基准测试中获佳绩，高级编程能力提升显著，擅长Web应用创建、智能体编程、代码转换与编辑。原生多模态处理能力配合超长上下文窗口，能处理多元信息源复杂问题。

编程成角力新前线 ：Gemini 2.5 Pro发布与DeepSeek -V3相隔不到30小时，二者均提升编程等能力并重点展示。ai编程能力提升将带来用户体验与生产效益变化，或成大模型厂商竞争方向。

# AI快讯

文章版权归作者所有，未经允许请勿转载。