5月15日,谷歌在其年度I/O开发者大会上发布了多项令人瞩目的人工智能产品和服务,这些新产品和功能不仅展示了谷歌在人工智能领域的最新进展,也表明了其面对竞争对手如OpenAI的战略布局。以下是大会发布的主要内容概览。
Gemini人工智能更新
谷歌对Gemini人工智能模型进行了更新,推出了Gemini 1.5 Pro,该模型能够处理更多数据,例如用户上传的1500页文本。此外,新增了更具成本效益的Gemini 1.5 Flash AI模型,专为小型任务设计。谷歌CEO Sundar Pichai强调了Gemini翻译功能的改进,并宣布将向全球所有开发者提供35种语言的支持。
Gemma 2:开放模型的27B参数版本
Gemma系列是谷歌的开放模型系列,谷歌宣布将于6月推出新一代的Gemma 2模型,带有270亿个参数。该模型将与Meta的Llama和Mistral开放模型竞争。此外,PaliGemma,一种预训练的Gemma变体,已可用于图像字幕、图像标签和视觉问答用例。
Google Veo、Imagen 3和音频概述
谷歌发布了Veo,用于生成高清视频的最新模型,以及Imagen 3,一个高质量的文本到图像模型,承诺提供逼真的图像。Veo在大会上亮相,它能够捕捉不同的视觉和电影风格,并允许编辑和调整已生成的镜头。
新的搜索功能
谷歌搜索负责人Liz Reid宣布,谷歌搜索将推出人工智能概述,为复杂搜索问题提供快速摘要。此外,谷歌还计划在搜索中引入类似助手的规划功能,并且将开始测试用户通过视频提问的能力。
Project Astra计划
Project Astra是谷歌人工智能助手的最新进展,由谷歌DeepMind AI部门构建。该助手旨在通过视频和音频帮助用户,例如帮助用户记住物品放置地点、检查代码等。
人工智能硬件
谷歌宣布推出第六代TPU(张量处理单元)Trillium,这是运行复杂AI操作的关键硬件。该处理器预计将于2024年底向云客户提供,其速度是之前版本的五倍。
谷歌的这些AI产品和服务的发布,不仅是对现有技术的提升,也为未来的人工智能应用奠定了基础。随着技术的不断进步,我们有理由期待谷歌在AI领域的更多突破。