谷歌I/O大会：AI革命，搜索升级，新项目与进化的Gemini

AI快讯2年前 (2024)更新 niko

五月I/O大会上，谷歌展示了其AI领域的最新进展。关键词“AI”在主题演讲中被提及超过120次，彰显了谷歌对AI的重视。

AI大模型新增及升级

谷歌宣布AI大模型的两个升级：Gemini 1.5 Pro的上下文窗口拓展到200万令牌，Gemini Nano增加了多模态理解能力。同时，谷歌发布了三个新的大模型：反应迅速的Gemini 1.5 Flash、结构优化的Gemma 2.0以及视觉语言模型PaliGemma。此外，谷歌的文生图模型Imagen迭代至Imagen 3，并推出了文生视频模型Veo。

谷歌搜索功能强化

在谷歌的核心产品搜索中，推出了AI Overviews，一个加强版AI搜索摘要功能，预计将首先在美国上架。谷歌搜索还计划加入制定计划、视频搜索等功能，推动搜索体验的进化。

Gemini与未来助理Project Astra

谷歌公布了新项目Project Astra，旨在打造未来通用AI助理。与上一代Google Assistant相比，Project Astra实现了模式多样性和实时交互，摒弃了唤醒词和延时问题，通过实时视频交互提供帮助。谷歌表示，Project Astra的部分功能将于今年晚些时候更新到Gemini及其他应用中。

Gemini Live与应用生态扩展

Gemini Live作为Gemini产品的一个重要演进，允许用户通过语音与AI进行更加流畅自然的对话，预计夏天上线。谷歌还计划年内将相机功能整合至其中，实现AI的实时视频交互。

Gemini普及与生态拓展

谷歌正将Gemini逐渐整合到其众多应用中，如Gmail邮箱、Google Messages通讯和谷歌照片等，展现了“Gemini无处不在”的策略。

大模型的竞争与挑战

尽管谷歌在大模型方面做出了许多升级和创新，但市场对这些新名词的反响并不热烈。谷歌似乎缺少一个如同OpenAI之前发布的GPT-4o那样足以震撼业界的产品。尽管如此，谷歌在AI领域的雄心壮志和不懈努力值得肯定。

# AI快讯

文章版权归作者所有，未经允许请勿转载。