近日,作家德里亚·巴茨(Andrea Bartz)等起诉Anthropic公司的集体诉讼案,以双方达成15亿美元和解协议落下帷幕。该案自2024年8月立案以来,便牵动科技与版权领域神经,最终结果及创纪录和解金额,为AI行业训练数据版权问题提供了标志性参照。
案件核心争议在于AI训练是否适用**合理使用规则**——这一允许特定场景下未经许可使用版权内容的法律条款,需满足四大判断标准:使用目的与性质、作品性质、使用规模、市场影响。
使用目的与性质是争议焦点。Anthropic主张训练AI模型是“变革性使用”,即将书籍内容转化为理解语言的工具,与原作“供阅读”的目的不同。但法院明确,变革性不能抵消“来源非法”的瑕疵:“创新过程不能为非法起点合理化”。作品性质方面,涉案小说、非虚构书籍均为创造性作品,法律保护力度远高于事实性汇编(如统计年鉴),使用这类作品训练本身就增加了合理使用的认定难度。使用规模上,AI训练需输入完整作品而非片段,Anthropic使用全本内容的行为,进一步降低了合理使用的可能性。市场影响上,原告举证显示Claude能生成与原作高度相似的内容,虽未完全替代创作,但已对版权市场构成潜在威胁。
2025年6月,加州北区地方法院法官威廉·阿尔苏普(William Alsup)的裁决为案件定调:合法购买的书籍训练或属合理使用,但从盗版网站下载的书籍“本质上构成侵权”。这意味着Anthropic若继续诉讼,将面临巨额法定赔偿——美国版权法对故意侵权的最高赔偿额达每部作品15万美元,涉案数百万册书籍的赔偿足以令企业破产。此外,持续诉讼还可能导致难以修复的品牌损伤。在此背景下,和解成为Anthropic的理性选择:以15亿美元换取法律确定性,切割侵权风险,协议还包含销毁相关盗版数据等严格约束条款。
该案的影响远超Anthropic自身,正在重塑AI行业规则。**数据合规将成为企业“生存必修课”**。过去部分AI企业以“技术中立”为名,忽视数据版权状态,批量抓取公开数据的模式,已被Anthropic案彻底否定。未来,AI企业需将数据授权成本纳入核心运营开支,无法证明数据来源清白的模型,将成为潜在风险。
**数据授权市场或迎来爆发**。新闻集团、出版商等内容持有者将加速与AI企业合作,通过授权内容获取新收入;类似音乐版权集体管理组织的“AI训练数据授权联盟”可能应运而生,连接创作者与企业,高效解决大规模授权问题。
**合规成为AI企业核心竞争力**。随着企业级客户将AI深度整合进业务流程,其对AI供应商的法律风险审查将更严格。能证明数据链路清晰、来源合法的企业,将在金融、法律、医疗等合规敏感行业获得巨大竞争优势;反之,数据来源模糊的模型将被视为“风险产品”,商业化应用受限。
Anthropic案并非AI版权争议的终点,而是规则明确的起点。未来,AI企业的竞争力不仅源于模型参数规模或能力涌现,更源于合规的“根基”——唯有建立在合法数据基础上的创新,才能持续发展。
本文来自微信公众号:腾讯科技,作者:李昀锴,编辑:晓静