在谷歌的I/O大会上,一项项AI革命技术背后的深度布局展现无遗。谷歌展示了包括Project Astra、Gemini、Gemini Flash、Gemini Live、Gems、Trillium TPU以及开源视觉大模型等多项革命性AI技术。
Project Astra作为谷歌的AI个人助理,与OpenAI提前一日的发布形成竞争。尽管如此,Astra的能力不容小觑,它能够理解空间,处理视频输入,并且在实际环境中一次完成演示效果。尽管Project Astra依然处于原型阶段,其未来表现令人期待。
接着是谷歌的Gemini,这是一个原生多模态大模型,去年发布的版本就因其长达100万token的上下文长度而广受欢迎。如今,Gemini 1.5 Pro已经向全球用户开放,未来更是计划开放200万token的上下文能力。此外,谷歌还推出了轻量版的Gemini Flash,提供更高的推理性能与更低的价格,预计将吸引更多开发者使用。
为了提升用户体验,谷歌不仅将推出用于直接语音交互的Gemini Live,还计划将其与谷歌日历、任务、备忘录等应用无缝连接。更重要的是,谷歌推出了Gems,允许用户创建专属于自己的AI助手。
谷歌在硬件方面的布局同样引人注目,发布了其第6代TPU——Trillium,这款芯片在性能和能效上均有显著提升,是谷歌AI产品背后的强大支持。
在开源领域,谷歌也展现了其责任与实力,推出了新的开源大模型Gema 2和首个开源的视觉大模型PaliGemma,这对于开源社区无疑是一次重大贡献。
谷歌的AI搜索同样值得关注,通过整合AI概览功能,谷歌能够在一个搜索结果中提供全面的信息,包括问题解答、travel assistance以及creative mind mapping等,极大地提升了用户体验。
此外,谷歌的多模态AI领域也有了新的进展,如视频生成模型Veo和Imagen 3的升级,进一步拓宽了AI在视觉创作领域的应用。Music AI Sandbox的推出更是为音乐人提供了强大的智能创作工具。
通过这一系列技术的展示,谷歌向我们证明了自己在AI领域的深远布局,不仅有着强大的工程技术支撑,也有着对未来AI浪潮的清晰洞察和准备。