谷歌发布gemini2.5推理模型 。近日,谷歌于开发者平台Google AIStUdio与Gemini应用程序,推出最新人工智能推理模型Gemini2.5。该模型具备停下来“思考”能力,是人工智能技术新进步。同时,谷歌还带来Gemini2.5ProExperimental这一多模式推理AI模型,被视为迄今最智能的模型。
服务订阅用户 体验强大能力 。Gemini2.5是针对每月20美元的Gemini Advanced订阅者的新服务,用户能借此体验其强大推理能力。
竞争激烈 推动技术发展。自2024年9月OpenAI发布首个AI推理模型,AnthroPic、DeepSeek、谷歌和xAI等科技公司纷纷推出推理模型竞争。推理技术应用让模型在数学和编程任务上表现更佳,推动人工智能发展。
Pro版测试成绩出色 。谷歌声称,Gemini2.5Pro在多个基准测试中超越之前模型及部分领先对手。如在AiderPolyglot代码编辑评估中获68.6%高分,超过OpenAI、Anthropic及DeepSeek的顶尖AI模型。在软件开发能力测试中,虽得分63.8%低于Anthropic的Claude3.7Sonnet的70.3%,但优于OpenAI的o3- mini和DeepSeek的R1。在“人类的最后考试”中,Gemini2.5Pro得18.8%,也优于多家竞争对手。
窗口提升 未来可期。Gemini2.5Pro配备100万个token的上下文窗口,能一次处理约75万个单词,超《指环王》系列长度。未来谷歌计划推出200万个token的上下文窗口,进一步提升模型能力。
竞争有力 定价未知 。谷歌在推理模型探索非首次,去年12月曾推Gemini“思考”版本。如今,Gemini2.5是谷歌对OpenAIo系列模型有力竞争者。不过,关于Gemini2.5Pro的API定价,谷歌暂未透露更多信息 。