Google DeepMind 在人工智能领域取得重大突破,其开发的第三代Dreamer通用算法成为焦点。长期以来,用一种通用算法解决各领域任务是AI行业的挑战,如今Dreamer算法做到了一次配置,便在150多种不同任务中超越专用方法。
Dreamer算法的独特构造是其成功关键。它由3个神经网络 构成:世界模型 预测行动结果,评论者 评估结果价值,行动者选择最优行动。这3个部分在行动者与环境互动时,依据重放经验同时训练。
在性能评估方面,研究团队从基准、《我的世界》、消融、扩展性 4个维度,对Dreamer在8个领域、超过150项任务进行测试。在基准测试里,Dreamer在适用领域可与顶尖专用算法媲美甚至更优;在《我的世界》中,它成为首个从零开始收集钻石的算法,且不依赖人工数据;消融测试发现多种鲁棒性技术提升了性能;扩展性测试表明,增加模型大小能提高任务性能并降低数据需求。
Dreamer算法凭借其基于无监督目标 的世界模型 ,为未来研究开辟新路径,如从互联网视频传授知识,以及实现跨领域学习单一世界模型 ,助力智能体积累通用知识和能力 ,推动强化学习迈向新高度。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
热门AI工具
Copyright © 2025 AI工具箱 鄂ICP备2024044990号-2