五月I/O大会上,谷歌展示了其AI领域的最新进展。关键词“AI”在主题演讲中被提及超过120次,彰显了谷歌对AI的重视。
AI大模型新增及升级
谷歌宣布AI大模型的两个升级:Gemini 1.5 Pro的上下文窗口拓展到200万令牌,Gemini Nano增加了多模态理解能力。同时,谷歌发布了三个新的大模型:反应迅速的Gemini 1.5 Flash、结构优化的Gemma 2.0以及视觉语言模型PaliGemma。此外,谷歌的文生图模型Imagen迭代至Imagen 3,并推出了文生视频模型Veo。
谷歌搜索功能强化
在谷歌的核心产品搜索中,推出了AI Overviews,一个加强版AI搜索摘要功能,预计将首先在美国上架。谷歌搜索还计划加入制定计划、视频搜索等功能,推动搜索体验的进化。
Gemini与未来助理Project Astra
谷歌公布了新项目Project Astra,旨在打造未来通用AI助理。与上一代Google Assistant相比,Project Astra实现了模式多样性和实时交互,摒弃了唤醒词和延时问题,通过实时视频交互提供帮助。谷歌表示,Project Astra的部分功能将于今年晚些时候更新到Gemini及其他应用中。
Gemini Live与应用生态扩展
Gemini Live作为Gemini产品的一个重要演进,允许用户通过语音与AI进行更加流畅自然的对话,预计夏天上线。谷歌还计划年内将相机功能整合至其中,实现AI的实时视频交互。
Gemini普及与生态拓展
谷歌正将Gemini逐渐整合到其众多应用中,如Gmail邮箱、Google Messages通讯和谷歌照片等,展现了“Gemini无处不在”的策略。
大模型的竞争与挑战
尽管谷歌在大模型方面做出了许多升级和创新,但市场对这些新名词的反响并不热烈。谷歌似乎缺少一个如同OpenAI之前发布的GPT-4o那样足以震撼业界的产品。尽管如此,谷歌在AI领域的雄心壮志和不懈努力值得肯定。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...