在AI模型激烈竞争的当下,GPT-4o凭借原生图像生成功能引发关注,一股吉卜力风迅速在网络传播。然而,谷歌的Gemini 2.5Pro并未被这股热度掩盖光芒,正以其卓越表现实现逆袭。
Gemini 2.5Pro刚发布不久,便在Chatbot竞技场脱颖而出,成功超越chatgpt-4o-latest以及Grok-3,荣登榜首。不仅如此,在一项智商测试中,它更是展现出超强实力,IQ高达130,离线得分也有118分,在所有模型中排名第一,这一成绩着实令人惊叹。
从实际应用来看,DeepMind研究员Fei Xia展示了Gemini 2.5 Pro的独特玩法。他先用Gemini 2.0 FlashImage将妻子所画的三层蛋糕转化为3D渲染图,接着让Gemini 2.5Pro编写OpenSCAD代码复制该3D模型,最终成功得到可爱的玩具。这一系列操作,充分体现了Gemini 2.5 Pro在3D建模方面的强大能力。
X上大V Shruti Mishra分享的实测用例,进一步凸显了Gemini 2.5Pro的多元应用。它能够使用Three.js创建3D汽车模拟器,生成旋转多边形和弹跳小球的动画,创建Minecraft游戏,生成并解开3D魔方,制作高尔顿板模拟器以及经典的3D飞行游戏等。在这些应用中,Gemini2.5 Pro的表现可圈可点,生成的内容有的更接近真实情况。
谷歌官方还带来好消息,Gemini Advanced用户现在可以在Gemini 2.5Pro中使用Canvas进行创作,并展示了仅用几分钟和几个提示就完成的3D恐龙世界示例。谷歌也在努力让更多人能够尽快试用Gemini 2.5 Pro。
综上所述,Gemini 2.5Pro凭借硬核的技术实力和丰富的实战应用,在视觉与空间领域崭露头角。无论是开发者、创作者,还是科技爱好者,都有必要重新认识这款实力强劲的模型。