谷歌年度开发者大会：AI新功能盘点

AI快讯2年前 (2024)更新 niko

5月15日，谷歌在其年度I/O开发者大会上发布了多项令人瞩目的人工智能产品和服务，这些新产品和功能不仅展示了谷歌在人工智能领域的最新进展，也表明了其面对竞争对手如OpenAI的战略布局。以下是大会发布的主要内容概览。

Gemini人工智能更新

谷歌对Gemini人工智能模型进行了更新，推出了Gemini 1.5 Pro，该模型能够处理更多数据，例如用户上传的1500页文本。此外，新增了更具成本效益的Gemini 1.5 Flash AI模型，专为小型任务设计。谷歌CEO Sundar Pichai强调了Gemini翻译功能的改进，并宣布将向全球所有开发者提供35种语言的支持。

Gemma 2：开放模型的27B参数版本

Gemma系列是谷歌的开放模型系列，谷歌宣布将于6月推出新一代的Gemma 2模型，带有270亿个参数。该模型将与Meta的Llama和Mistral开放模型竞争。此外，PaliGemma，一种预训练的Gemma变体，已可用于图像字幕、图像标签和视觉问答用例。

Google Veo、Imagen 3和音频概述

谷歌发布了Veo，用于生成高清视频的最新模型，以及Imagen 3，一个高质量的文本到图像模型，承诺提供逼真的图像。Veo在大会上亮相，它能够捕捉不同的视觉和电影风格，并允许编辑和调整已生成的镜头。

新的搜索功能

谷歌搜索负责人Liz Reid宣布，谷歌搜索将推出人工智能概述，为复杂搜索问题提供快速摘要。此外，谷歌还计划在搜索中引入类似助手的规划功能，并且将开始测试用户通过视频提问的能力。

Project Astra计划

Project Astra是谷歌人工智能助手的最新进展，由谷歌DeepMind AI部门构建。该助手旨在通过视频和音频帮助用户，例如帮助用户记住物品放置地点、检查代码等。

人工智能硬件

谷歌宣布推出第六代TPU（张量处理单元）Trillium，这是运行复杂AI操作的关键硬件。该处理器预计将于2024年底向云客户提供，其速度是之前版本的五倍。

谷歌的这些AI产品和服务的发布，不仅是对现有技术的提升，也为未来的人工智能应用奠定了基础。随着技术的不断进步，我们有理由期待谷歌在AI领域的更多突破。

# AI快讯

文章版权归作者所有，未经允许请勿转载。