Google Gemini 2.0系列上线：性能、性价比与多模态的全面升级

AI快讯1年前 (2025)发布 niko

Google Deedmind在去年底推出的Gemini 2.0 Flash模型，率先叩响智能体时代2.0的大门。时隔两个月，备受瞩目的Gemini2.0系列全家桶正式亮相。此次发布在DeepSeek带来的「鲶鱼效应」作用下，展现出诸多不同之处，不仅在性能层面实现跃升，还扛起AI性价比大旗，多模态能力更是成为一大亮点。

在当下的大模型竞技场上，Gemini 2.0 Pro在所有类别中拔得头筹，Gemini 2.0 Flash位居第三，而Flash-lite凭借出色的性价比成功跻身前十。Deepmind CEO Demis Hassabis表示，团队在提升模型质量的同时，致力于降低成本，Gemini2.0系列在性价比和性能方面均为领先模型，且其强大的推理和多模态能力将为智能工作筑牢根基。

Gemini 2.0系列模型各有千秋。2.0 Pro Experimental着重于编码性能与处理复杂提示的能力，在知识理解和逻辑推理方面表现卓越；2.0Flash专为开发者提供API接口，助力快速构建App；2.0 Flash Thinking Experimental已在GeminiApp中开放，供用户体验；2.0 Flash-Lite在维持高性能的同时，实现了成本效益和响应速度的优化。

已全面发布的Gemini 2.0Flash支持多模态输入与文本输出，拥有100万tokens的上下文窗口，还具备结构化输出、函数调用和代码执行等功能。不过，其多模态实时API目前处于「beta」阶段，图像和音频输出功能将在后续推出。该模型的定价方案已确定，文本、图像和视频输入每百万tokens收费0.10美元，音频输入为0.70美元（2月20日起正式生效），文本输出每百万tokens收费0.40美元。各类缓存费用也维持在较低水平。在此基础上，Google推出更具性价比的「轻量版」——Gemini2.0 Flash-Lite。虽然它在功能上有所取舍，暂不支持多模态实时API、搜索工具和代码执行，但保留了核心功能。其定价更为亲民，文本、图像和视频输入每百万tokens仅需0.075美元，几乎比标准版便宜三分之一。

产品线顶端的Gemini 2.0 ProExperimental版本拥有200万tokens的超大上下文窗口，功能最为全面，支持多模态输入和文本输出，具备结构化输出、函数调用、搜索工具和代码执行等全方位能力。在性能测试方面，Gemini2.0系列表现不俗，但即便最强的Gemini 2.0 Pro Experimental版本也落后于OpenAI o3模型。不过有网友认为，由于Gemini2.0Pro并非典型的CoT模型，当前的性能对比可能并不完全合理。这些模型的优势在于快速响应能力和较低成本，适用于特定任务，随着新功能推出，应用场景将进一步拓展。目前，新模型已在GoogleAI Studio和Vertex AI平台向开发者开放，Gemini高级用户也可在设备上选用。

随着Gemini 2.0全家桶上线，网友玩出了新花样。比如让Gemini 2.0设计贪吃蛇游戏，Gemini 2.0 FlashThinking模型能访问YouTube，支持Google搜索和地图功能。在图像渲染方面，开发者让模型使用p5.js编写脚本，生成了特定的三维场景。在Gemini崭露头角之时，OpenAI也在发力，宣布DeepResearch功能向所有Pro用户全面开放，ChatGPT的搜索功能也向所有用户开放。此外，AI模型的命名问题也引发关注，众多公司都在努力寻找更简单、清晰的命名方式。

# AI快讯

文章版权归作者所有，未经允许请勿转载。