gemini 2.5 Pro性能卓越
上周推出的Gemini 2.5Pro虽被GPT-4o吉卜力生图光芒掩盖,但实力强劲。在试用中,该模型展现出超强能力,在门萨Norway的IQ测试中突破130,在MathArena测试中获第一名,且所用题目大多是LLM未见过的。在哈佛-麻省理工大学数学竞赛中也领先第二名15%,在数学方面超越多数研究生,在网友统计的AI模型能力表上,领先趋势明显。
免费开放,惠及大众
如今,好消息传来,谷歌官宣向所有Gemini用户推出Gemini 2.5Pro实验版,且全免费。尽管目前存在速率限制,但所有用户都能体验其强大功能。GeminiAdvanced用户则享有更高级访问权限和更大上下文窗口。此前,该模型仅面向GeminiAdvanced订阅者开放,订阅价格每月19.99美元,后续还将推广到安卓和iOS应用上。
社区公认,领先群雄
AI社区Reddit上,网友公认谷歌的模型已领先。在众多测试和投票中,如LiveBench、LMSYS等,Gemini表现出色,是无可争议的领军者。根据ArtificialAnalysis评估,Gemini 2.5在多数测试中排名第一,输出速度仅次于Gemini 2.0 Flash。尽管LLM本质是概率性的,但Gemini2.5 Pro成绩斐然。
编程能力,出类拔萃
谷歌技术主管Addy Osmani称Gemini 2.5Pro是谷歌最佳编程模型且免费。它能在Three.js中进行物理模拟,多次提示可改进编程效果。网友Gadgetify复刻「宇宙模拟器」,elvis认为它是Claude3.7 Sonnet的最强对手。初步编码测试显示,Gemini 2.5 Pro提升了行业水平,不少网友体验后表示Claude面临挑战。
© 版权声明
文章版权归作者所有,未经允许请勿转载。