美国当地时间周三,谷歌正式推出了Gemini 2.0,这一AI模型套件堪称谷歌目前最强之作,且面向大众全面开放。

早在2024年12月,谷歌就已向部分开发者和测试人员提供了Gemini2.0的访问权限,并将部分功能融入谷歌产品。此次“全面发布”意义重大,所有新模型均可通过谷歌AI Studio和Gemini API供开发者使用。
Gemini 2.0模型套件版本多样。其中,Gemini 2.0 Flash被誉为“高效的工作模型”,适合大规模、高频率任务处理,现已在AIStudio和Vertex AI上线并全面开放;Gemini 2.0 ProExperimental在编码和数学任务中展现出更好的事实准确性与更强性能,被视为谷歌“最强模型”,在AI Studio和VertexAI上线,面向Gemini高级用户;Gemini 2.0 Flash-Lite是“最具成本效益的模型”,速度和价格与1.5Flash相近,但多数基准测试表现更优,拥有100万个tokens上下文窗口和多模式输入。

价格方面,Gemini Flash每百万个Token收费10美分,Gemini Flash-Lite更具成本效益,每百万个Token仅0.75美分。Token作为模型处理的数据单元,涵盖文本、图像和视频输入。

谷歌曾在2024年12月的博客中提到,过去一年致力于开发更智能模型,Gemini2.0具备更强多模态能力,支持图像和音频输出,拥有原生工具使用能力,将助力构建新AI智能体,迈向通用助手愿景。
此次发布是谷歌加大AI智能体投资的举措之一。随着AI竞争加剧,谷歌在“虚拟代理”AI方面持续推进。Meta、亚马逊、微软、OpenAI和Anthropic等公司也在开发能完成复杂多步骤任务的AI系统。
2024年10月,Anthropic宣布其AI智能体可如人类般使用电脑完成复杂任务;OpenAI推出“Operator”功能,能自动完成多项任务,还推出“DeepResearch”功能帮助编写报告。谷歌在2024年12月也推出同名工具Deep Research作为“研究助手”。

据悉,谷歌计划2025年初推出更多AI功能,其首席执行官桑达尔·皮查伊表示要做到最好。