未经许可重复使用原创文章训练模型，OpenAI 遭美国 8 家报纸出版商起诉

作者：清源

2024-05-01 04:12

感谢据 CNBC 报道，当地时间 4 月 30 日，8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼，声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章，还将信息的不准确性归咎于出版商本身。图源 Pixabay根据 8 家出版商向美国纽约南区地方法院提交的诉状，ChatGPT 一直在“未经许可、未付款”的情况下，盗用了出版商数百万篇受版权保护的文章。IT之家查询发现，参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛

感谢据 CNBC 报道，当地时间 4 月 30 日，8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼，声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章，还将信息的不准确性归咎于出版商本身。

图源 Pixabay

根据 8 家出版商向美国纽约南区地方法院提交的诉状，ChatGPT 一直在“未经许可、未付款”的情况下，盗用了出版商数百万篇受版权保护的文章。

IT之家查询发现，参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛邮报》《橙郡纪事报》和《先锋报》，这些出版商都为对冲基金 Alden Global Capital 所有。

这些出版商在指控中表示，OpenAI 利用包含其报纸文本的数据集来训练其 GPT-2 和 GPT-3 模型；微软则从报纸上复制信息，用于必应搜索索引，或作为其 AI 助手所提供答案的信息来源。“当前的 GPT-4 LLM 在收到提示时，会输出出版商作品相当一部分内容的近乎逐字逐句的副本。”

OpenAI 发言人在声明中表示，公司之前“并不知道”Alden Global Capital 的担忧，但目前正积极与世界各地的多个新闻机构开展“建设性的”合作与对话，以探索机会、化解担忧及提供解决方案。微软则拒绝对此发表评论。

未经许可重复使用原创文章训练模型，OpenAI 遭美国 8 家报纸出版商起诉

相关资讯

美国新闻媒体联盟致信贸易委员会、司法部，要求调查谷歌在新闻领域的垄断行为

没有授权也没关系？多家 AI 公司被曝绕过网络标准抓取新闻出版商网站内容

被指过度抓取内容后，AI 搜索公司 Perplexity 和出版社达成协议