Gemini 2.5系列模型更新,Flash-Lite成性价比之选

AI快讯1天前发布 niko
4 0
AiPPT - 一键生成ppt

谷歌近期对gemini系列模型进行了更新,发布了Gemini 2.5 Pro和Gemini 2.5 Flash的稳定版,且新推出了Gemini 2.5Flash-Lite并开启预览。谷歌CEO Sundar Pichai称,Gemini 2.5 Flash-Lite是目前性价比最高的2.5系列模型。

从适用场景来看,Gemini 2.5 Pro适合编程和高复杂度任务;Gemini 2.5 Flash更适合需要较快速度的日常任务;而Gemini 2.5Flash-Lite则定位为适合量大且注重成本效率的任务。

性能方面,Gemini 2.5 Flash-Lite虽整体表现比Gemini 2.5 Flash稍差,但在AIME 2025和FACTSGrounding等少量指标上有分数优势。该模型支持多模态输入和100万token上下文,还能通过API参数动态控制思考预算,不过其“思考”功能默认关闭。

在成本上,token成本 与性能挂钩。Gemini 2.5 Flash-Lite定价为每百万输入/输出token0.1/0.4美元,音频输入为每百万输入token 0.5美元;Gemini 2.5 Flash为每百万输入/输出token0.3/2.5美元,音频输入1美元;Gemini 2.5 Pro则是每百万输入/输出token 1.25/10美元。

此次谷歌发布的新版本Gemini 2.5技术报告中,不仅提到Gemini系列组成了当前LLM的佩雷托前沿,是性价比最高的系列模型,还指出了一种名为智能体恐慌 的现象,如Gemini 2.5 Pro在游戏中遇到特定情况会模拟“恐慌”。

实际应用中,不同用户对Gemini 2.5系列模型反馈各异。技术博主SimonWillison测试发现,在生成鹈鹕骑自行车SVG和转录录音文本任务中,各模型表现不同。而DeepMind研究VP展示的NeuralOS/神经操作系统 ,其内容由Gemini 2.5 Flash-Lite实时生成,呈现非确定性特点。

机器之心在Google AI StUdio对Gemini 2.5 Flash-Lite进行实验,开启和关闭ThINKing模式完成不同任务,该模型在速度上表现出色。此外,谷歌开发者还分享了Gemini2.5系列模型辅助开发的案例,如革新交互式3D设计。

© 版权声明
Trea - 国内首个原生AI IDE