Google Gemini 2.0系列上线:性能、性价比与多模态的全面升级

AI快讯2周前发布 niko
83 0
AiPPT - 一键生成ppt

Google Deedmind在去年底推出的Gemini 2.0 Flash模型,率先叩响智能体时代2.0的大门。时隔两个月,备受瞩目的Gemini2.0系列全家桶正式亮相。此次发布在DeepSeek带来的「鲶鱼效应」作用下,展现出诸多不同之处,不仅在性能层面实现跃升,还扛起AI性价比大旗,多模态能力更是成为一大亮点。

在当下的大模型竞技场上,Gemini 2.0 Pro在所有类别中拔得头筹,Gemini 2.0 Flash位居第三,而Flash-lite凭借出色的性价比成功跻身前十。Deepmind CEO Demis Hassabis表示,团队在提升模型质量的同时,致力于降低成本,Gemini2.0系列在性价比和性能方面均为领先模型,且其强大的推理和多模态能力将为智能工作筑牢根基。

Gemini 2.0系列模型各有千秋。2.0 Pro Experimental着重于编码性能与处理复杂提示的能力,在知识理解和逻辑推理方面表现卓越;2.0Flash专为开发者提供API接口,助力快速构建App;2.0 Flash Thinking Experimental已在GeminiApp中开放,供用户体验;2.0 Flash-Lite在维持高性能的同时,实现了成本效益和响应速度的优化。

已全面发布的Gemini 2.0Flash支持多模态输入与文本输出,拥有100万tokens的上下文窗口,还具备结构化输出、函数调用和代码执行等功能。不过,其多模态实时API目前处于「beta」阶段,图像和音频输出功能将在后续推出。该模型的定价方案已确定,文本、图像和视频输入每百万tokens收费0.10美元,音频输入为0.70美元(2月20日起正式生效),文本输出每百万tokens收费0.40美元。各类缓存费用也维持在较低水平。在此基础上,Google推出更具性价比的「轻量版」——Gemini2.0 Flash-Lite。虽然它在功能上有所取舍,暂不支持多模态实时API、搜索工具和代码执行,但保留了核心功能。其定价更为亲民,文本、图像和视频输入每百万tokens仅需0.075美元,几乎比标准版便宜三分之一。

产品线顶端的Gemini 2.0 ProExperimental版本拥有200万tokens的超大上下文窗口,功能最为全面,支持多模态输入和文本输出,具备结构化输出、函数调用、搜索工具和代码执行等全方位能力。在性能测试方面,Gemini2.0系列表现不俗,但即便最强的Gemini 2.0 Pro Experimental版本也落后于OpenAI o3模型。不过有网友认为,由于Gemini2.0Pro并非典型的CoT模型,当前的性能对比可能并不完全合理。这些模型的优势在于快速响应能力和较低成本,适用于特定任务,随着新功能推出,应用场景将进一步拓展。目前,新模型已在GoogleAI Studio和Vertex AI平台向开发者开放,Gemini高级用户也可在设备上选用。

随着Gemini 2.0全家桶上线,网友玩出了新花样。比如让Gemini 2.0设计贪吃蛇游戏,Gemini 2.0 FlashThinking模型能访问YouTube,支持Google搜索和地图功能。在图像渲染方面,开发者让模型使用p5.js编写脚本,生成了特定的三维场景。在Gemini崭露头角之时,OpenAI也在发力,宣布DeepResearch功能向所有Pro用户全面开放,ChatGPT的搜索功能也向所有用户开放。此外,AI模型的命名问题也引发关注,众多公司都在努力寻找更简单、清晰的命名方式。

© 版权声明
智谱清言 - 国产最强AI模型
AiPPT - 一键生成ppt