谷歌I/O大会：AI驱动的未来与Gemini模型新进展

AI快讯2年前 (2024)更新 niko

5月15日，谷歌在一年一度的I/O开发者大会上展示了其在人工智能领域的最新成就。会议期间，谷歌高管们共提及’AI’一词超过120次，凸显了AI在谷歌战略中的核心地位。DeepMind联合创始人戴密斯·哈萨比斯在会上发表了演讲，表明AI大模型已成为谷歌的首要任务。

谷歌CEO桑达尔·皮查伊宣布，谷歌推出了22项AI新技术，包括Gemini 1.5 Pro进阶版、Gemini 1.5 Flash轻量级模型、通用AI Agent、Imagen 3图像生成模型、Music AI Sandbox音乐创作工具、Veo视频生成模型以及PaliGemma视觉语言开放模型等。此外，谷歌还预告了下一代Gemma 2大模型，以及一系列AI基础设施和搜索功能的新进展。

在AI助手方面，谷歌展示了Project Astra，这是一个能够实时解答问题并提供创造性回答的AI助手。而Veo模型则能够在70秒内生成不同视觉风格的高质量视频，展示了谷歌在视频生成领域的技术实力。

Imagen 3是谷歌发布的最高质量的图像生成模型，它能够理解复杂的文本提示并生成高分辨率的图像。Music AI Sandbox则是与音乐家合作开发的AI音乐创作工具，它可以帮助音乐家快速将灵感转化为旋律。

谷歌还公布了Gemini 1.5 Pro的进阶版，这是一个多模态、上下文窗口扩展至200万个token的模型，支持35种语言。而轻量级模型Gemini 1.5 Flash则针对低延迟和低成本任务进行了优化。

在AI搜索方面，谷歌搜索将很快推出多轮推理能力，支持视频搜索，并增强了对Gemini模型的利用，使得用户可以更直观地通过图片或视频获取信息。谷歌还宣布了一系列AI系统，包括RT-2、SIMA和AlphaGeometry等。

谷歌的AI技术正在逐步深入人们的日常生活，其在I/O大会上的展示无疑证明了该公司在AI领域的领导地位。随着新技术的不断涌现，未来谷歌的AI技术将如何继续推动产业发展，值得我们拭目以待。

# AI快讯

文章版权归作者所有，未经允许请勿转载。