OpenAI十二天活动开启，或连续揭示AI领域重大突破

AI快讯2年前 (2024)发布 niko

近期，科技界的目光聚焦在了人工智能领域，特别是在谷歌DeepMind与OpenAI两大巨头的竞争中。DeepMind在深夜发布了其最新基础世界模型Genie 2，预示着玩家们通过一张图片即可进入游戏世界的未来已经到来。这个模型能够生成各种可操作、可玩的3D环境，其准确性和连贯性象征着AI的’理解’而非仅仅’模仿’世界运作规律的能力。

与此呼应，OpenAI也不甘示弱，宣布了一个为期十二天的圣诞惊喜活动，将开展一系列直播和新内容或演示的展示。Sam Altman在社交媒体平台上宣布，从太平洋时间上午十点开始，OpenAI将为公众带来一系列新内容的发布和展示，既有重磅活动也有一些小惊喜，内容丰富，令人拭目以待。在网友的预测中，OpenAI可能发布的内容极为丰富和壮观，从文本到视频AI工具Sora的发布，到ChatGPT引入圣诞老人灵感的声音功能，以及新的视觉功能、o1-preview的发布等等。人们期待将看到AI的最新进展和应用展示。

接着，讨论焦点聚集在了DeepMind的Genie 2模型上。这一代的Genie模型开发的是一个2D世界，而Genie 2则迈进了生成丰富多彩3D世界的一大步。Genie 2展现出的理解能力令人印象深刻，它能准确预测控制角色的行为，并实时生成连贯的画面。这一技术的进步之所以令人兴奋，是因为它不仅能够模拟各种物理现象，还能模拟智能体行为，并且支持多样的视角和对象交互。官方发布的演示视频展示了用户与Genie 2互动过程，使得人们能够直观地了解到Genie 2的潜力和特色的互动功能。

从更实际的应用场景出发，Genie 2的高强度可塑性和模拟能力为游戏开发者、艺术家和设计师等创作者提供了强大的支撑，他们可以通过这个平台快速创建丰富多样的交互式环境，并能够模拟复杂的物理现象和行为。这样的能力大大缩小了创造和模拟环境之间的技术壁垒，使得创作者能够更加专注于创意和设计，而无需在技术的实现上花费过多精力。

尽管DeepMind团队透露Genie 2目前仅处于早期研究阶段，但在智能体和环境生成能力上尚有很大的提升空间，人们对于它的未来充满了期待。Genie 2在结构性问题上可能是解决训练具身智能体的关键，并有望实现向通用人工智能（AGI）发展的广度和泛化性，这被视为一个重要的里程碑。

Genie 2模型的技术原理是通过自回归的潜在扩散模型，并经过大规模视频数据集的训练。这一过程使得模型在推理时能够逐帧处理，基于过去的潜在帧和当前的动作生成新的帧。该技术的出现将重新定义‘拍照’的含义，预计每张照片都可能成为一个通向完整虚拟世界的入口。在技术层面，这也是从2D到3D，AI创造力的维度飞跃。

整体而言，无论是OpenAI的十二天活动，还是DeepMind在Genie 2上的突破，人工智能领域正在迎来激动人心的进展和创新。随着这一系列活动的持续进行和新技术的不断涌现，我们必将见证AI如何在未来的各个领域中发挥其巨大的影响力。

# AI快讯

文章版权归作者所有，未经允许请勿转载。