Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法

本周 Meta 在法庭文件中声称,尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型,但公司员工已采取措施,确保在下载过程中未对任何文件进行“种子分享(seeding)”。在文件共享术语中,“种子分享”指在下载文件时(或下载完成后)将文件共享给其他用户。由于文件共享是基于点对点网络系统,每个下载文件的用户都可以将文件的一部分上传给其他用户。

本周 Meta 在法庭文件中声称,尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型,但公司员工已采取措施,确保在下载过程中未对任何文件进行“种子分享(seeding)”。在文件共享术语中,“种子分享”指在下载文件时(或下载完成后)将文件共享给其他用户。由于文件共享是基于点对点网络系统,每个下载文件的用户都可以将文件的一部分上传给其他用户。

Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法

Meta 的律师表示,目前没有任何事实表明 Meta 在下载过程中分享了原告的书籍。这意味着 Meta 的辩护策略主要依赖于目前缺乏证据证明其在下载过程中共享了相关资料。尽管 Meta 声称没有证据表明其进行了种子分享,但 Meta 负责项目管理的高管迈克尔・克拉克(Michael Clark)在证词中提到,他们所使用的配置设置经过调整,“以尽可能减少种子分享的发生”。然而,在被问及为何要减少种子分享时,克拉克以律师-客户特权为由拒绝回答。

克拉克的声明表明,Meta 确实试图减少种子分享,但尚未提供证据表明其完全阻止了版权资料的共享。此外,Meta 研究员弗兰克・张(Frank Zhang)的一条内部消息可能暗示公司试图掩盖其服务器上可能的种子分享行为,以避免“追踪种子分享者 / 下载者的风险”回到 Facebook 服务器。

Meta 的辩护似乎主要围绕缺乏证据证明其在下载大量数据时进行共享这一事实展开。如果 Meta 的辩护成功,证明下载版权内容本身并不违法,而只有分发才是违法的,这可能会对未来的版权侵权和未经授权的版权内容分发案件产生深远影响。此外,Meta 将辩护重点放在种子分享上,可能是为了在法律上制造混淆,进一步模糊其涉嫌明知违法仍下载受版权材料的指控。

Meta 尚未对是否知晓其在下载过程中共享数据的指控作出回应。版权材料的作者声称,Meta 是“非法点对点盗版网络的知情参与者”,并指责 Meta“绕过合法获取方式,参与非法点对点盗版网络”。

AI在线注意到,类似的案件并不罕见。2023 年,OpenAI 曾被小说家起诉,而《纽约时报》也因“数百万”篇新闻文章被抄袭而起诉 OpenAI 和微软。随着越来越多与大型语言模型相关的诉讼不断涌现,Meta 的这一案件可能只是冰山一角。

相关资讯

Meta AI 全球市场扩张,并上线网页版 meta.ai

Meta 公司近日宣布 Llama 3 大语言模型之外,扩展 Meta AI 服务到美国之外的 13 个国家和地区,还宣布上线专门的聊天网站:meta.ai。Meta 公司在新闻稿中表示开始在全球市场扩展 Meta AI,在澳大利亚、加拿大、南非和新加坡等国家和地区推出英语版本。IT之家附上 Meta AI 扩展的国家和地区如下澳大利亚加拿大加纳牙买加马拉维新西兰尼日利亚巴基斯坦新加坡南非乌干达赞比亚津巴布韦Meta AI 整合了 Llama 3 大语言模型,速度更快、智能性更高、功能更强,是执行各种任务的理想选择

Llama3后,Meta又开放自家头显操作系统,打造元宇宙时代新安卓

虽然向第三方开放了操作系统,但 Meta 将继续开发 Quest 头显设备。Meta 誓将开放进行到底。这次把自家 VR 头显 Quest 采用的操作系统「Meta Horizon OS」向第三方硬件制造商开放了,包括华硕、联想和微软等一众企业。此举意在展示作为 MR 操作系统整合者的 Meta 对元宇宙开放的新愿景。至此,Meta 正式向实现元宇宙更开放的计算平台愿景迈出下一步。为实现该恢弘战略,Meta 同时在三方面不断发力,并竭力整合资源:向第三方硬件制造商开放 Meta Quest 设备的操作系统,为消费者

不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?

3D 生成,一直在等待它的「ChatGPT时刻」。一直以来,创作 3D 内容是设计和开发视频游戏、增强现实、虚拟现实以及影视特效中最重要的部分。然而,3D 生成具有独特而艰巨的挑战,这是图像和视频等其他生成内容所不具备的。首先,3D 内容在艺术质量、生成速度、3D 网格结构和拓扑质量、UV 贴图结构以及纹理清晰度和分辨率方面具有严格的标准;其次,与其他研究相比,可用的数据量少。虽然该领域有数十亿张图像和视频可供学习,但可用于训练的 3D 内容数量要少三到四个数量级。因此,现阶段的3D 生成还必须从非 3D 的图像和