OpenAI 在训练数据诉讼案中意外删除《纽约时报》等收集的关键证据

据The Verge报道,当地时间周三提交的法庭文件披露,OpenAI 工程师在一次“令人震惊的”失误中,意外删除了《纽约时报》和其他主要报纸在AI训练数据诉讼中收集的关键证据。
感谢据 The Verge 报道,当地时间周三提交的法庭文件披露,OpenAI 工程师在一次“令人震惊的”失误中,意外删除了《纽约时报》和其他主要报纸在 AI 训练数据诉讼中收集的关键证据

该文件称,这些报纸的法律团队花了 150 多个小时搜索 OpenAI 的人工智能训练数据,以查找包含其新闻文章的实例。但文件未说明 OpenAI 的“误删”如何发生,也未明确这些数据具体包含了什么。

尽管文件指出,OpenAI 承认了这一错误并尝试恢复数据,但最终恢复的数据不完整且不可靠 —— 因此,无法有效追踪这些新闻机构的文章在构建 OpenAI 的人工智能模型中的具体用途。OpenAI 的律师将数据被删除描述为一个“故障”,《纽约时报》的律师则表示,他们“没有理由相信”这是故意的。

据AI在线此前报道,《纽约时报》去年 12 月起诉了 OpenAI 公司,声称 OpenAI 及其合作伙伴微软通过“复制和使用数百万篇”该出版物的文章来构建其 AI 工具,现在因此“直接与其内容竞争”。《纽约时报》要求 OpenAI 赔偿“数十亿美元”的法定及实际损失。

报道提到,《纽约时报》已为这场诉讼投入超过 100 万美元(AI在线备注:当前约 724.8 万元人民币)的费用,这对许多出版商来说都是难以承受的开销。然而,OpenAI 已与包括 Axel Springer、康泰纳仕和《The Verge》母公司 Vox Media 在内的主流媒体达成合作,显示许多出版商更倾向于合作而非对抗。

相关资讯

反转?OpenAI:纽约时报「黑客攻击」了ChatGPT,要求驳回版权诉讼

去年年底,《纽约时报》向微软和 OpenAI 提起侵犯版权诉讼,指控其违规使用了《纽约时报》的内容来进行人工智能开发。在这份起诉书中,《纽约时报》列出了 GPT-4 输出「抄袭」《纽约时报》的「证据」,GPT-4 的许多回答与《纽约时报》的报道段落几乎完全一致:《纽约时报》指责 OpenAI 和微软试图「搭《纽约时报》对其新闻业的巨额投资的便车」,并创建报纸的替代品。彼时,《纽约时报》发言人在一份电子邮件声明中表示:「如果微软和 OpenAI 想要将我们的作品用于商业目的,法律要求他们首先要获得我们的许可,但他们没

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

自从 OpenAI 的 o1 问世以来,它强大的推理能力就承包了 AI 圈近期的热搜。不需要专门训练,它就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。展示 o1 实力的 demo,我们看了不少,评估 o1 表现的评测,全网比比皆是,关于 o1 技术路线的讨论也如火如荼,引发了广泛的关注和深入的思考。不过 o1 背后的故事,还鲜为人知,那些在幕后默默付出的团队成员们,他们的故事同样值得被讲述和铭记。刚刚,OpenAI 发布了 o1 研发团队的完整访谈,为我们揭秘了 o1 的「成长历程」。o

LeCun批评o1根本不像研究,Noam Brown回怼:已发表的研究都是废话

图灵奖三巨头之一 Yann LeCun 又和别人吵起来了,这次是 Noam Brown。Noam Brown 为 OpenAI o1 模型的核心贡献者之一,此前他是 Meta FAIR 的一员,主导了曾火遍一时的 CICERO 项目,在 2023 年 6 月加入 OpenAI  。这次吵架的内容就是围绕 o1 展开的。众所周知,从 AI 步入新的阶段以来,OpenAI 一直选择了闭源,o1 的发布也不例外。这也引来了广大网友的吐槽,干脆叫 CloseAI 算了,反观 Meta,在开源领域就做的很好,o1 的发布,更