AI助手与搜索的未来：Google I/O大会上的革新与展望

AI快讯2年前 (2024)更新 niko

796 0 0

再一次，AI技术界的“魔术师”以令人惊叹的手法展示了一场精彩绝伦的表演；然而转眼间，科技界另一巨头已经准备好将这些神奇的秘密散布到每一个人的手中。

Google I/O 大会：AI时代的开幕

是的，与24小时前那些充满科幻感的展示相比，今天在Google I/O开发者大会上的宣布更有着令人信服的力量，让我们意识到AI的时代就在我们身边，正如Google CEO所描述的“Gemini时代”。

“Gemini时代”的启幕

一年前，在2023年的Google I/O大会上，Google宣布了Gemini模型的诞生。这个模型在过去一年中虽然经历了一些争议，但到了今天，它已经为Google的各项服务带来了变革，从搜索到Google助理，再到工作软件的全家桶。

轻量级模型的诞生

Google推出了Gemini 1.5 Flash轻量级模型，这一举动旨在解决用户对于延迟和成本问题的抱怨。Gemini 1.5 Flash的推出，意味着更快的速度和更高的效率，进一步扩充了AI技术的覆盖范围。

Gemini 1.5 Flash继承了大模型的多模态处理能力，更擅长于总结、聊天、图像和视频的凝练，以及从长文档和表格中提取信息。它是通过从Gemini 1.5 Pro“蒸馏”技术得到的，这种技术让小型模型能够学习大型模型的知识与技能。

Gemini 1.5 Pro的开放

随着Google I/O大会的落幕，Gemini 1.5 Pro已经全面开放，覆盖150个国家，支持35种语言。用户只需订阅Gemini Advanced，即可访问。此外，这一模型支持高达100万个tokens的理解，是目前大模型服务中最长的上下文输入，能够轻松处理1500页的文档总结或100封邮件摘要。

年底前，这一数字将增加到200万，届时，Gemini 1.5 Pro将会处理视频和代码库，充当数据分析师，从上传的表格中及时发现洞察，并创建自定义的可视化。

Google办公软件的智能化

Google办公全家桶也将在未来几个月内推出新功能，如智能问答、智能邮件回复、表格图像化总结等，这些功能将由全面整合的Gemini支持。这些改进包括对模型的改进，使其能够更好地控制特定的用例，遵循用户的复杂操作指令。

个性化AI助理的出现

在I/O大会上，DeepMind的CEO Demis Hassabis宣布了新的Google智能助理。Google希望AI助理变得更智能，更加个性化。Gemini将成为你的私人AI助理，具有对话式的交流和用户友好的交互能力，正如Project Astra所展现的那样。

Google助理的能力将包括语音交互、多项功能的自然对话，以及即将上线的Gemini Live功能，它将允许实时通过摄像头观察你的环境。此外，Google还通过Extensions功能将Gemini连接到更多Google应用，使得从Google应用和服务中获取的信息能够被调用。

智能助理的记忆功能也将得到加强。例如，当你通过摄像头进行交互后询问眼镜的位置，助理能够根据最近的画面准确回答你的问题，这展示了智能助理对细节的惊人记忆能力。

搜索产品的进化

Google搜索的未来是AI Overviews，这一功能能够简化用户的问题，并具备多步推理的能力，为用户提供了高度格式化的解释、行动指引和后续行为链接。未来的搜索功能可能不再只是一个单独的“搜索引擎”，而是由AI增强的Agent功能的一部分。

除了图片搜索，Google还宣布将支持视频提问搜索，这将带来比语言描述更清晰的指引，尤其是在复杂或需要视觉辅助的场景中。

AI责任的讨论

在讨论AI责任时，Google展示了SynthID工具，旨在解决AI生成内容的泛滥问题。SynthID将能够识别AI生成的图片、声音、文字和视频，以应对科研领域的滥用现象。

Google的AI技术不仅强调了其创新性，也突出了对社会责任的承诺。它们在I/O大会上的展示，无疑为AI的未来带来了激动人心的前景。

# AI快讯

文章版权归作者所有，未经允许请勿转载。