Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

最新研究显示,Meta不仅使用盗版书籍训练AI模型,还通过BitTorrent重新上传30%的已下载书籍,延长了盗版作品的传播周期。专家指出,Meta的上传量异常偏高,涉嫌变相成为盗版网络节点。此事件可能重塑AI行业数据获取规则。#Meta盗版争议##AI数据获取#

科技媒体 WinBuzzer 昨日(3 月 26 日)发布博文,报道称最新研究显示,Meta 在数字图书盗版链中的参与度远超预期。

消息称 Meta 公司使用 LibGen、Z-Library 等“影子图书馆”的盗版书籍训练 AI 模型外,还通过 BitTorrent 重新上传约 30% 的已下载书籍,客观上延长了盗版作品的传播周期。

Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

专家指出,尽管 BitTorrent 默认会分片上传数据,但 Meta 的上传量异常偏高,涉嫌变相成为盗版网络节点。

AI在线曾于今年 2 月报道,Meta 在法庭文件中声称,尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型,但公司员工已采取措施,确保在下载过程中未对任何文件进行“种子分享(seeding)”

Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

不过最新研究指出的二次上传行为可能颠覆这一论点,澳大利亚前总理马尔科姆・特恩布尔发现著作被盗用,斥其“极度不安”,美国普利策奖得主迈克尔・夏邦等已提起诉讼,法国出版商指控 Meta 的行为是“对版权作品的大规模掠夺”。

欧盟委员会已关注此事,可能依据《欧盟 AI 法案》严惩。若法院最终认定 Meta 需为训练数据获取正式授权,将重塑 AI 行业数据获取规则。目前案件走向尚未明朗,但这场版权争议注定成为数字时代知识产权保护的标杆性事件。

相关阅读:

  • 《Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法》

  • 《Meta 深陷盗版泥潭,邮件曝光 81.7 TB AI 训练数据黑幕》

  • 《Meta 遭遇版权诉讼,扎克伯格被指亲自批准 AI 团队用盗版书训练模型》

相关资讯

Meta AI 全球市场扩张,并上线网页版 meta.ai

Meta 公司近日宣布 Llama 3 大语言模型之外,扩展 Meta AI 服务到美国之外的 13 个国家和地区,还宣布上线专门的聊天网站:meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI,在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型,速度更快、智能性更高、功能更强,是执行各种任务的理想选择

Llama3后,Meta又开放自家头显操作系统,打造元宇宙时代新安卓

虽然向第三方开放了操作系统,但 Meta 将继续开发 Quest 头显设备。Meta 誓将开放进行到底。这次把自家 VR 头显 Quest 采用的操作系统「Meta Horizon OS」向第三方硬件制造商开放了,包括华硕、联想和微软等一众企业。此举意在展示作为 MR 操作系统整合者的 Meta 对元宇宙开放的新愿景。至此,Meta 正式向实现元宇宙更开放的计算平台愿景迈出下一步。为实现该恢弘战略,Meta 同时在三方面不断发力,并竭力整合资源:向第三方硬件制造商开放 Meta Quest 设备的操作系统,为消费者

不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?

3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和