美国当地时间周二,谷歌DeepMind人工智能研究团队推出了gemini 2.5 Pro “I/O” ,这是Gemini 2.5Pro的升级版本。DeepMind CEO德米斯·哈萨比斯称其为有史以来构建的最强编程模型。从谷歌公布的初步基准测试结果来看,在关键的代码生成评估指标上,谷歌首次全面领先,超越所有竞争对手。
新版本编号为 “Gemini-2.5-pro-preview-05-06”,取代了03-25版本。目前,该模型已向Google AIStUdio的独立开发者、VertexAI云平台的企业用户以及Gemini应用的普通用户开放,还为Gemini移动应用中的Canvas等功能提供支持。它广泛用于Gemini95等开发场景,能自动匹配用户界面组件视觉风格,支持一系列高效开发工作流 ,例如将YouTube视频快速转换为互动学习应用等,几乎无需手动编写CSS。
作为专有模型,企业用户通过谷歌云服务平台付费使用,且谷歌未调整定价或速率限制。目前使用Gemini 2.5Pro的用户将自动切换至新模型,价格为每百万输入token收费1.25美元,每百万输出token收费10美元,最多支持20万token的上下文窗口,相比AnthroPic的Claude3.7 Sonnet更具性价比。此外,此次更新重点提升了函数调用的准确率与触发可靠性,解决了开发者此前的反馈问题。
谷歌此次更新亮点显著,只需一条提示就能构建完整、可交互的网页应用或模拟程序,降低了设计导向型开发者或创新团队的入门门槛。虽然底层架构及技术细节未公开,但实际应用效果显示其目标是提供高效、直观的开发体验。凭借代码生成与多模态输入优势,它正从研究模型转变为实用工具,提前发布意在响应市场需求,保持技术领先。
在第三方平台WebDev Arena的排行榜中,Gemini 2.5 ProPreview(05-06)在生成美观且实用的网页应用方面获得人类评审最高分 ,超越Anthropic的Claude 3.7Sonnet登顶榜首。其得分为1499.95,远高于Sonnet 3.7的1377.10,相比此前版本的Gemini 2.5Pro(03-25)实现了221分的大幅跃升。
多个知名开发者与平台负责人对Gemini 2.5 ProPreview(05-06)在实际生产环境中的表现给予高度评价。Hyperbolic联合创始人称其已成为首选编程模型;AI初创公司Cognition联合创始人表示它是首个成功完成复杂后端路由系统重构的AI模型;ai编程工具Cursor的CEO认为新模型在实用性方面有明显提升;基于浏览器的云端协同开发平台Replit总裁称其在性能与响应延迟之间取得最佳平衡;AI教育工作者、AI艺术工具首席执行官等也对其能力表示赞赏。这些赞誉预示着它将在更多开发平台中获得广泛采纳。