谷歌展示AI新进展：Gemini 1.5 Pro升级，Project Astra亮相

AI快讯2年前 (2024)更新 niko

796 0 0

在2024年的谷歌I/O大会上，一系列令人瞩目的人工智能技术被展示出来。CEO桑达尔·皮查伊自信地宣布，我们已全面进入Gemini时代。以下是大会的亮点概述。

Gemini 1.5 Pro：上下文长度升级至200万token

Gemini 1.5 Pro的最显著特性之一是其上下文长度的重大提升，达到200万tokens，远超当前所有大型语言模型，这一特性现已向个人用户开放。
Gemini的升级意味着可以处理更长的视频、音频、代码和文字数据，为用户带来更丰富的应用场景。

Project Astra：谷歌版GPT-4o

面临OpenAI GPT-4o的挑战，谷歌推出了Project Astra，其视觉识别和语音交互效果与GPT-4o相当。
Project Astra的演示显示了其高度的多模态交互能力，包括理解复杂的视觉场景和代码，以及准确的记忆和预测能力。

Veo：文生视频模型超越Sora

谷歌的文生视频模型Veo以其高达1分钟的视频生成能力和电影级别的视觉质感，挑战了OpenAI的Sora。
Veo的发布标志着一种新的创作可能性，为电影制作人员提供了新的工具，使每个人都能成为导演。

Gemini重塑谷歌搜索

谷歌搜索即将经历一次重大变革，通过Gemini的整合，用户将无需手动点击搜索结果，而是直接由AI生成的概述代理。
Gemini的介绍，将通过多步骤推理和个性化AI总结，极大地简化用户的搜索体验。

谷歌搜索的AI化改造

谷歌宣布，将在谷歌搜索中全面集成AI技术，将搜索和整合信息的功能提升到一个全新的水平。

视觉-语言开源模型PaliGemma

谷歌发布了第一个视觉-语言开源模型PaliGemma，专门用于优化图像标注和标注化任务。

TPU Trillium：性能飞跃

支撑这些技术进步的基础设施是谷歌的TPU。第六代TPU Trillium的性能比前代提升了4.7倍，支持更复杂的AI模型训练。

总结

谷歌展示了其在AI领域的最新技术和创新，预示了一个由AI助手深刻改变的未来。

参考资料：
– Gemini开发者更新
– Trillium TPU介绍
– 大会视频演示

本文内容根据谷歌I/O 2024大会发布信息整理而成。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

AI工具箱，全方位AI资源聚合平台，精选全球3000+优质免费AI应用，涵盖ppt生成, AI写作、AI编程、AI绘画、AI设计、AI论文、AI视频、AI配音、AI音乐、AI金融等多个领域领域的AI工具软件。包含扣子、扣子空间、DeepSeek、Gamma等热门AI工具。致力于让AI技术触手可及，助力用户高效工作，加速技术创新与产业应用落地，推动人工智能应用革新。

AI写作 AI设计 AI配音 AI音乐 AI图片生成 AI数字人 AI视频生成网站地图商务合作关于我们

Copyright © 2026 AI工具箱官网鄂ICP备2024044990号-2

鄂公网安备42010402001699号