OpenAI 在训练数据诉讼案中意外删除《纽约时报》等收集的关键证据

作者：清源

2024-11-22 11:03

据The Verge报道，当地时间周三提交的法庭文件披露，OpenAI 工程师在一次“令人震惊的”失误中，意外删除了《纽约时报》和其他主要报纸在AI训练数据诉讼中收集的关键证据。

感谢据 The Verge 报道，当地时间周三提交的法庭文件披露，OpenAI 工程师在一次“令人震惊的”失误中，意外删除了《纽约时报》和其他主要报纸在 AI 训练数据诉讼中收集的关键证据。

该文件称，这些报纸的法律团队花了 150 多个小时搜索 OpenAI 的人工智能训练数据，以查找包含其新闻文章的实例。但文件未说明 OpenAI 的“误删”如何发生，也未明确这些数据具体包含了什么。

尽管文件指出，OpenAI 承认了这一错误并尝试恢复数据，但最终恢复的数据不完整且不可靠 —— 因此，无法有效追踪这些新闻机构的文章在构建 OpenAI 的人工智能模型中的具体用途。OpenAI 的律师将数据被删除描述为一个“故障”，《纽约时报》的律师则表示，他们“没有理由相信”这是故意的。

据AI在线此前报道，《纽约时报》去年 12 月起诉了 OpenAI 公司，声称 OpenAI 及其合作伙伴微软通过“复制和使用数百万篇”该出版物的文章来构建其 AI 工具，现在因此“直接与其内容竞争”。《纽约时报》要求 OpenAI 赔偿“数十亿美元”的法定及实际损失。

报道提到，《纽约时报》已为这场诉讼投入超过 100 万美元（AI在线备注：当前约 724.8 万元人民币）的费用，这对许多出版商来说都是难以承受的开销。然而，OpenAI 已与包括 Axel Springer、康泰纳仕和《The Verge》母公司 Vox Media 在内的主流媒体达成合作，显示许多出版商更倾向于合作而非对抗。

OpenAI 在训练数据诉讼案中意外删除《纽约时报》等收集的关键证据

相关资讯

反转？OpenAI：纽约时报「黑客攻击」了ChatGPT，要求驳回版权诉讼

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

LeCun批评o1根本不像研究，Noam Brown回怼：已发表的研究都是废话