Meta 被曝助推数字盗版：30% 训练 AI 书籍遭二次传播

作者：故渊

2025-03-27 09:36

最新研究显示，Meta不仅使用盗版书籍训练AI模型，还通过BitTorrent重新上传30%的已下载书籍，延长了盗版作品的传播周期。专家指出，Meta的上传量异常偏高，涉嫌变相成为盗版网络节点。此事件可能重塑AI行业数据获取规则。#Meta盗版争议##AI数据获取#

科技媒体 WinBuzzer 昨日（3 月 26 日）发布博文，报道称最新研究显示，Meta 在数字图书盗版链中的参与度远超预期。

消息称 Meta 公司使用 LibGen、Z-Library 等“影子图书馆”的盗版书籍训练 AI 模型外，还通过 BitTorrent 重新上传约 30% 的已下载书籍，客观上延长了盗版作品的传播周期。

Meta 被曝助推数字盗版：30% 训练 AI 书籍遭二次传播

专家指出，尽管 BitTorrent 默认会分片上传数据，但 Meta 的上传量异常偏高，涉嫌变相成为盗版网络节点。

AI在线曾于今年 2 月报道，Meta 在法庭文件中声称，尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型，但公司员工已采取措施，确保在下载过程中未对任何文件进行“种子分享（seeding）”。

Meta 被曝助推数字盗版：30% 训练 AI 书籍遭二次传播

不过最新研究指出的二次上传行为可能颠覆这一论点，澳大利亚前总理马尔科姆・特恩布尔发现著作被盗用，斥其“极度不安”，美国普利策奖得主迈克尔・夏邦等已提起诉讼，法国出版商指控 Meta 的行为是“对版权作品的大规模掠夺”。

欧盟委员会已关注此事，可能依据《欧盟 AI 法案》严惩。若法院最终认定 Meta 需为训练数据获取正式授权，将重塑 AI 行业数据获取规则。目前案件走向尚未明朗，但这场版权争议注定成为数字时代知识产权保护的标杆性事件。

相关阅读：

相关资讯