gemini 2.5 Flash全新登场 :谷歌继o4-mini后,推出Gemini 2.5 Flashpreview版本。该版本作为更注重效率的Flash,在大模型竞技场上成绩斐然,排名并列第二,仅次于自家的Gemini 2.5 Pro。
混合推理与深度调控优势 :Gemini 2.5Flash是一款混合推理模型,具备自由设定思考深度的特性。这一功能对于预算有限的用户极为友好,能有效控制推理成本。若不进行设置,模型也会自行判断适宜的思考深度,避免过度思考。
竞技场上的亮眼表现 :在大模型竞技场中,经过3000多轮对战,Gemini 2.5Flash取得1392分的成绩,与Grok-3、GPT-4.5等模型并列第二。在编程、复杂提示和长文本三个子榜单中,与Pro版并列第一。在WebDev榜单里,位列第七,超越了前一代的Pro版本。
性价比凸显 :Gemini 2.5Flash在谷歌自家模型中性价比最高,价格为0.15/0.6/3.5美元每百万输入/输出/推理Token,相比o4-mini便宜不少。按照输入输出3:1的比例计算,在大模型竞技场1400分附近,它是最便宜的模型之一。
与o4-mini的竞争角逐 :由于Gemini的Flash版本和OpenAI的mini类似,且上线时间邻近,Gemini 2.5Flash被视为o4-mini的竞争者。从谷歌官方成绩单看,在一些高难度测试集中,其表现稍逊于o4-mini,但考虑价格因素,差距尚可接受。
实际应用对比:在实际应用测试中,编程能力方面o4-mini胜;数据分析能力上Gemini胜;多模态理解能力两者各有表现。总体而言,不考虑价格,Gemini 2.5Flash与o4-mini有差距,但考虑性价比,其综合竞争力有所体现。
© 版权声明
文章版权归作者所有,未经允许请勿转载。