在数字化浪潮下,创意产业因生成式AI掀起变革。不过,将其融入游戏开发这一复杂创意领域困难重重。游戏开发对内容的一致性、多样性和持续性平衡要求极高。
近日,Nature上的研究论文揭示了利用生成式AI模型推动游戏玩法创意生成的方法。微软研究院领导的团队开发出可协助电子游戏设计师迭代设计游戏的生成式AI模型——世界与人类行动模型(WHAM),它生成的鲁棒3D世界能遵循电子游戏机制。
电子游戏在娱乐产业中占据重要地位,但传统游戏开发流程复杂,生成式AI虽为解决开发难题提供可能,现有模型在游戏开发应用中却面临诸多挑战。
为此,研究团队邀请27名不同游戏工作室的电子游戏设计师开展半结构化访谈,使用“设计探针”工具了解其需求。设计师们认为生成式AI应能提供多样化内容、保持一致性、支持迭代实践和具备持续性。基于此,研究团队开发了WHAM。
WHAM模型采用Transformer架构和VQGAN图像编码器,通过对《嗜血边缘》中人类玩家玩法数据的训练,能准确预测游戏环境的3D结构等。
研究团队发现,WHAM能设计出符合《嗜血边缘》机制的复杂3D电子游戏序列,关卡设计多样且支持迭代调整。为评估其性能,团队提出一套针对生成式AI模型的评估方法,从一致性、多样性和持续性三方面进行评估。
一致性评估用FVD指标对比生成与真实游戏画面;多样性评估采用Wasserstein距离衡量动作分布差异;持续性评估通过编辑游戏图像插入元素,观察生成画面中元素的持续情况。结果显示,WHAM在这三方面表现出色。
研究团队指出,WHAM为游戏开发行业带来全新工具,激发创意人员灵感,也为生成式AI在其他创意领域应用提供借鉴。不过,WHAM存在收集处理数据复杂耗时、训练优化需大量资源和专业知识等局限。但随着AI技术发展,其模型架构和训练方法有望改进。