5月15日,谷歌在一年一度的I/O开发者大会上展示了其在人工智能领域的最新成就。会议期间,谷歌高管们共提及’AI’一词超过120次,凸显了AI在谷歌战略中的核心地位。DeepMind联合创始人戴密斯·哈萨比斯在会上发表了演讲,表明AI大模型已成为谷歌的首要任务。
谷歌CEO桑达尔·皮查伊宣布,谷歌推出了22项AI新技术,包括Gemini 1.5 Pro进阶版、Gemini 1.5 Flash轻量级模型、通用AI Agent、Imagen 3图像生成模型、Music AI Sandbox音乐创作工具、Veo视频生成模型以及PaliGemma视觉语言开放模型等。此外,谷歌还预告了下一代Gemma 2大模型,以及一系列AI基础设施和搜索功能的新进展。
在AI助手方面,谷歌展示了Project Astra,这是一个能够实时解答问题并提供创造性回答的AI助手。而Veo模型则能够在70秒内生成不同视觉风格的高质量视频,展示了谷歌在视频生成领域的技术实力。
Imagen 3是谷歌发布的最高质量的图像生成模型,它能够理解复杂的文本提示并生成高分辨率的图像。Music AI Sandbox则是与音乐家合作开发的AI音乐创作工具,它可以帮助音乐家快速将灵感转化为旋律。
谷歌还公布了Gemini 1.5 Pro的进阶版,这是一个多模态、上下文窗口扩展至200万个token的模型,支持35种语言。而轻量级模型Gemini 1.5 Flash则针对低延迟和低成本任务进行了优化。
在AI搜索方面,谷歌搜索将很快推出多轮推理能力,支持视频搜索,并增强了对Gemini模型的利用,使得用户可以更直观地通过图片或视频获取信息。谷歌还宣布了一系列AI系统,包括RT-2、SIMA和AlphaGeometry等。
谷歌的AI技术正在逐步深入人们的日常生活,其在I/O大会上的展示无疑证明了该公司在AI领域的领导地位。随着新技术的不断涌现,未来谷歌的AI技术将如何继续推动产业发展,值得我们拭目以待。