Meta被指非法下载大量盗版书籍用于AI训练遭质疑

AI快讯3个月前发布 niko
6 0
AiPPT - 一键生成ppt

近期,Meta公司在人工智能训练领域的举动引发广泛瞩目。据一项诉讼透露,该公司被指在未获授权情况下,大量下载盗版电子书及文章,用于人工智能模型训练。

版权,盗版

此次事件的关键在于几封泄露邮件,这些邮件为Meta的相关行为提供了更多实证。邮件显示,Meta承认下载了颇具争议的大型数据集LibGen,其中包含数千万本盗版书籍。依据原告提交的法庭文件,Meta通过Anna’sArchive网站,从多个影子图书馆下载至少81.7TB数据,其中来自Z-Library和LibGen的至少有35.7TB。此外,Meta此前还从LibGen下载过80.6TB数据,这一非法行为规模令人咋舌。

原告指出,即便小规模盗版行为都可能面临法律追究,而Meta的行径更为严重。邮件内容还显示,Meta员工对该行为的法律风险有所担忧。2023年4月,公司研究工程师尼古拉・巴什利科夫称‘用公司笔记本电脑下BT感觉不妥’。到2023年9月,其反对声音加剧,并咨询法律团队,指出‘使用Torrents意味着对文件进行“播种”,即对外共享内容,这在法律上不被允许’。然而,即便有此类警告,Meta仍决定隐瞒下载和共享活动,通过编辑设置降低‘播种’行为的可追溯性。

据悉,Meta还尝试将数据集下载至非Meta服务器,以降低被追溯到服务器的风险。这一系列行为促使外界对Meta公司在数据使用与版权方面展开深刻思考。

© 版权声明
Trea - 国内首个原生AI IDE