谷歌I/O大会：一项项AI革命技术背后的深度布局

AI快讯2年前 (2024)更新 niko

在谷歌的I/O大会上，一项项AI革命技术背后的深度布局展现无遗。谷歌展示了包括Project Astra、Gemini、Gemini Flash、Gemini Live、Gems、Trillium TPU以及开源视觉大模型等多项革命性AI技术。

Project Astra作为谷歌的AI个人助理，与OpenAI提前一日的发布形成竞争。尽管如此，Astra的能力不容小觑，它能够理解空间，处理视频输入，并且在实际环境中一次完成演示效果。尽管Project Astra依然处于原型阶段，其未来表现令人期待。

接着是谷歌的Gemini，这是一个原生多模态大模型，去年发布的版本就因其长达100万token的上下文长度而广受欢迎。如今，Gemini 1.5 Pro已经向全球用户开放，未来更是计划开放200万token的上下文能力。此外，谷歌还推出了轻量版的Gemini Flash，提供更高的推理性能与更低的价格，预计将吸引更多开发者使用。

为了提升用户体验，谷歌不仅将推出用于直接语音交互的Gemini Live，还计划将其与谷歌日历、任务、备忘录等应用无缝连接。更重要的是，谷歌推出了Gems，允许用户创建专属于自己的AI助手。

谷歌在硬件方面的布局同样引人注目，发布了其第6代TPU——Trillium，这款芯片在性能和能效上均有显著提升，是谷歌AI产品背后的强大支持。

在开源领域，谷歌也展现了其责任与实力，推出了新的开源大模型Gema 2和首个开源的视觉大模型PaliGemma，这对于开源社区无疑是一次重大贡献。

谷歌的AI搜索同样值得关注，通过整合AI概览功能，谷歌能够在一个搜索结果中提供全面的信息，包括问题解答、travel assistance以及creative mind mapping等，极大地提升了用户体验。

此外，谷歌的多模态AI领域也有了新的进展，如视频生成模型Veo和Imagen 3的升级，进一步拓宽了AI在视觉创作领域的应用。Music AI Sandbox的推出更是为音乐人提供了强大的智能创作工具。

通过这一系列技术的展示，谷歌向我们证明了自己在AI领域的深远布局，不仅有着强大的工程技术支撑，也有着对未来AI浪潮的清晰洞察和准备。

# AI快讯

文章版权归作者所有，未经允许请勿转载。