OpenAI 在训练数据诉讼案中意外删除《纽约时报》等收集的关键证据

2024-11-22 11:03

据The Verge报道，当地时间周三提交的法庭文件披露，OpenAI 工程师在一次“令人震惊的”失误中，意外删除了《纽约时报》和其他主要报纸在AI训练数据诉讼中收集的关键证据。

感谢据 The Verge 报道，当地时间周三提交的法庭文件披露，OpenAI 工程师在一次“令人震惊的”失误中，意外删除了《纽约时报》和其他主要报纸在 AI 训练数据诉讼中收集的关键证据。

该文件称，这些报纸的法律团队花了 150 多个小时搜索 OpenAI 的人工智能训练数据，以查找包含其新闻文章的实例。但文件未说明 OpenAI 的“误删”如何发生，也未明确这些数据具体包含了什么。

尽管文件指出，OpenAI 承认了这一错误并尝试恢复数据，但最终恢复的数据不完整且不可靠 —— 因此，无法有效追踪这些新闻机构的文章在构建 OpenAI 的人工智能模型中的具体用途。OpenAI 的律师将数据被删除描述为一个“故障”，《纽约时报》的律师则表示，他们“没有理由相信”这是故意的。

据AI在线此前报道，《纽约时报》去年 12 月起诉了 OpenAI 公司，声称 OpenAI 及其合作伙伴微软通过“复制和使用数百万篇”该出版物的文章来构建其 AI 工具，现在因此“直接与其内容竞争”。《纽约时报》要求 OpenAI 赔偿“数十亿美元”的法定及实际损失。

报道提到，《纽约时报》已为这场诉讼投入超过 100 万美元（AI在线备注：当前约 724.8 万元人民币）的费用，这对许多出版商来说都是难以承受的开销。然而，OpenAI 已与包括 Axel Springer、康泰纳仕和《The Verge》母公司 Vox Media 在内的主流媒体达成合作，显示许多出版商更倾向于合作而非对抗。

反转？OpenAI：纽约时报「黑客攻击」了ChatGPT，要求驳回版权诉讼

去年年底，《纽约时报》向微软和 OpenAI 提起侵犯版权诉讼，指控其违规使用了《纽约时报》的内容来进行人工智能开发。在这份起诉书中，《纽约时报》列出了 GPT-4 输出「抄袭」《纽约时报》的「证据」，GPT-4 的许多回答与《纽约时报》的报道段落几乎完全一致：《纽约时报》指责 OpenAI 和微软试图「搭《纽约时报》对其新闻业的巨额投资的便车」，并创建报纸的替代品。彼时，《纽约时报》发言人在一份电子邮件声明中表示：「如果微软和 OpenAI 想要将我们的作品用于商业目的，法律要求他们首先要获得我们的许可，但他们没

2/28/2024 5:51:00 PM

机器之心

法院允许《纽约时报》对 OpenAI 的版权诉讼继续进行

在近日的一场法律争斗中，OpenAI 公司的请求被驳回，法院决定允许《纽约时报》对其提起的版权诉讼继续进行。此案的核心是《纽约时报》指控 OpenAI 在未获得许可和支付的情况下，使用了其内容。美国纽约南区法院的法官西德尼・斯坦（Sidney Stein）在一份命令中，尽管缩小了诉讼的范围，但仍然允许主要的版权侵权指控继续进行。

3/27/2025 1:58:00 PM

AI在线