AI技术发展引发音乐行业变革
自AI技术特别是像ChatGPT这样的智能应用问世以来,人工智能如何改变人们的工作已经成为广泛讨论的热点话题。由于直接受AI冲击的职业群体强烈反对AI声音的扩散,音乐人群体尤其受到关注。从年初环球音乐与TikTok的纷争,到索尼音乐频频发出警告信,音乐行业似乎显示出对AI技术的’PTSD’(创伤后应激障碍)反应。现在,我们终于找到了音乐行业为何激烈反对AI技术的具体原因。
音乐人收入缩水研究
国际作者和作曲家协会(CISAC)最近公布的一份研究报告预测,由于AI的影响,音乐行业从业者在未来四年的收入可能会缩水近四分之一。预计到2028年,AI生成的音乐将在传统音乐流媒体平台上的收入中占到两成,而在音乐库存收入中的比例更是可能高达六成,表明创作者的经济价值正在向AI公司转移。CISAC的主席、前瑞典ABBA乐队成员比约恩·乌尔瓦斯警告说,如果没有合理的监管,’生成式AI将对人类创作者的职业生涯和生计造成严重损害’,他呼吁政策制定者介入以保护人类创作者的权益。
AI音乐的忧虑与反响
不仅仅是传统音乐人对AI音乐的广泛使用表示反对,即使是AI音乐初创企业也对这一趋势表达了担忧。Stability AI的前音频副总裁Ed Newton-Rex此前在一次媒体采访中表示,’AI音乐显而易见将蚕食支付给人类音乐家的版税和收入。’未来收入的减少可能会影响到音乐人对AI的看法。CISAC得出的结论不仅合理,而且在多模态AI模型更新迭代下,可能还比预估的情况更为严重。
考虑到音乐创作的复杂性,不同于视频和图像,音乐包括节拍、和声、旋律、和弦在数字层面上几乎无限,但能在大众中获得成功的却只占极少数。现流行音乐雷同化的现象也由此可见,歌曲听起来悦耳却有熟悉的感觉是因为音符组合有限,创作出全新作品非常困难,而像采样技术这种大规模应用更是加剧了音乐同质性。AI的加入将极大地加速了高流行度音乐作品的创作速度,凭借强大的算法能力和海量数据的辅助,预期AI音乐模型能创造出大众更喜欢的音乐作品。
例如,昆仑万维所推出的国内首个音乐SOTA(State of the Art)模型’SkyMusic’采用了类似Sora的模型架构,运用Large-scale Transformer进行谱曲,来学习Music Patches的上下文依赖关系,并利用Diffusion Transformer完成演唱,再通过LDM将Music Patches转换成高质量音频。根据昆仑万维的消息,SkyMusic可生成80秒44100Hz采样率的双声道立体声歌曲。Suno公司的“Covers”翻唱功能在市场上进一步拓展,它可以将任何音频或歌曲转化为全新风格,同时巧妙地保留原有旋律的精髓。音乐行业与其他领域不同,科技的发展使普通人也能以一定的水平参与音乐创作,例如Suno宣称的目标就是让每个人都能将心中的音乐灵感通过简便工具转化为实际作品。
音乐人与AI的角力引发了忧虑,他们不仅仅担心创作空间受到压缩,更担心AI技术使普通人也有能力体验甚至参与音乐创作,这对音乐行业的商业伦理构成了挑战。索尼音乐、环球音乐和CISAC都认识到AI音乐产品可能带来的变革,而像索尼音乐这样的既得利益者现在选择与AI厂商不合作,不提供音乐内容,以阻止AI厂商因缺乏语料而无法迭代AI的状态。
未来趋势的想象
音乐行业与AI的对峙最终会呈现何种局面,是类似于数字音乐发展的历史还是传统力量再度占据上风?这个问题只能让时间给出答案。但目前可以预见的是,随着AI技术的进一步发展和普及,音乐行业的格局、创作与分发方式将会面临前所未有的变化,音乐人如何在新的环境中找到自己的位置,也是所有人所期待解答的问题。