Google DeepMind 发布全新 AI 助手 Project Astra，迎战 OpenAI GPT-4o

AI快讯2年前 (2024)更新 niko

引言

随着人工智能技术的飞速发展，Google DeepMind 的首席执行官 Demis Hassabis 携带谷歌版《Her》——Project Astra，迅速吸引了全球科技界的目光。这一 AI 助手的发布，标志着谷歌在与 OpenAI 的竞争中迈出了关键一步。

Project Astra 是基于 Gemini 系列模型开发的，设计目标是成为人们日常生活中的得力助手。这款 AI 助手不仅能流畅地与人类交流，还能通过摄像头帮助用户阅读代码，显示了谷歌在多模态交互领域的深厚实力。

Gemini 1.5 Pro 展现了其惊人的上下文窗口能力，达到了 200 万 token，这意味着它可以处理长达 1500 页的 PDF 文件，进一步巩固了谷歌在大模型领域的领先地位。

谷歌不仅仅在 AI 助手领域有所突破，还推出了能生成超过 1 分钟长视频的 Veo，这与春节期间广受关注的 Sora 形成了直接的竞争关系。Veo 在视频生成的质量和一致性上展现了卓越的表现。

谷歌的另一项创新是图像生成模型 Imagen，随着 Imagen 3 的发布，其在视觉伪影减少和图像细节生成方面取得了显著进步。此外，谷歌还推出了音乐生成模型 Lyria，进一步证明了谷歌在多种艺术创作领域的开拓精神。

谷歌在其 I/O 大会上展示了如何将 Gemini 集成到全线产品中，包括谷歌搜索、Android 系统，以及谷歌邮箱、谷歌 Photos 等。这些集成让用户体验得到了显著提升，尤其是在搜索和日常工作流程的效率方面。

谷歌搜索的 AI 概述功能（AI Overview）能够快速为用户的问题提供汇总答案，处理复杂的查询，甚至帮助制定计划和提供决策支持。

在 Android 系统中，Gemini 的集成使得用户能够通过简单的手势进行搜索，并在各个应用之间无缝地使用 AI 助手。

Google Photos 的 Ask Photos 功能和谷歌 Workspace 的生产力工具，如谷歌邮箱和 Docs，也因 Gemini 的加入而变得更加智能和直观。

最后，在硬件方面，谷歌宣布其第六代 TPU Trillium 将在今年向云客户提供服务。这款新一代的硬件在性能和能效比方面都取得了显著的提升。

谷歌在 I/O 大会上展示的技术进步不仅仅是对 OpenAI 的回应，更是对整个人工智能领域的一次重大推进。随着 Gemini 模型的不断升级和 AI 技术在各个产品线的深入整合，我们有理由相信，谷歌将继续在 AI 领域扮演重要的角色。

如需了解更多谷歌 I/O 的信息，可以访问官方博客获取更多细节：谷歌官方博客。

文章版权归作者所有，未经允许请勿转载。