未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉

感谢据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。图源 Pixabay根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛
感谢据 CNBC 报道,当地时间 4 月 30 日,8 家美国报纸出版商在纽约的一家联邦法院对微软、OpenAI 提起诉讼,声称后者未经许可在生成式 AI 产品中重复使用这些出版商创作的文章,还将信息的不准确性归咎于出版商本身。

未经许可重复使用原创文章训练模型,OpenAI 遭美国 8 家报纸出版商起诉

图源 Pixabay

根据 8 家出版商向美国纽约南区地方法院提交的诉状,ChatGPT 一直在“未经许可、未付款”的情况下,盗用了出版商数百万篇受版权保护的文章。

IT之家查询发现,参与诉讼的出版商包括《纽约每日新闻》《芝加哥论坛报》《奥兰多哨兵报》《佛罗里达太阳哨兵报》《圣何塞水星报》《丹佛邮报》《橙郡纪事报》和《先锋报》,这些出版商都为对冲基金 Alden Global Capital 所有。

这些出版商在指控中表示,OpenAI 利用包含其报纸文本的数据集来训练其 GPT-2 和 GPT-3 模型;微软则从报纸上复制信息,用于必应搜索索引,或作为其 AI 助手所提供答案的信息来源。“当前的 GPT-4 LLM 在收到提示时,会输出出版商作品相当一部分内容的近乎逐字逐句的副本。”

OpenAI 发言人在声明中表示,公司之前“并不知道”Alden Global Capital 的担忧,但目前正积极与世界各地的多个新闻机构开展“建设性的”合作与对话,以探索机会、化解担忧及提供解决方案。微软则拒绝对此发表评论。

相关资讯

美国新闻媒体联盟致信贸易委员会、司法部,要求调查谷歌在新闻领域的垄断行为

美国“新闻 / 媒体联盟”(News / Media Alliance)本周致信美国联邦贸易委员会和美国司法部,敦促两部门调查谷歌垄断数字新闻出版的行为,并要求阻止谷歌通过其“无处不在”的搜索产品中使用生成式 AI 进行进一步扩张。“新闻 / 媒体联盟”关注的焦点是谷歌最新推出的“AI Overviews(AI 概述)”,并声称这一功能擅自利用出版商内容对用户的查询作全面回应,因而引起人们的警惕。该机构表示,谷歌通过利用出版商的专有资料,不仅有可能使内容创作者失去重要的流量,还破坏了数字新闻传播的基本完整性。“新闻

没有授权也没关系?多家 AI 公司被曝绕过网络标准抓取新闻出版商网站内容

据路透社上周六报道,专注于“内容许可”领域的初创公司 TollBit 近日向新闻出版商发出警告称,多家人工智能公司正在规避出版商用来阻止抓取内容的常见网络标准,并将抓取的内容用于训练生成式 AI 系统。这一消息是在 AI 搜索初创公司 Perplexity 与媒体《福布斯》之间就同一网络标准公开争执的背景下发出的。当前,科技和媒体公司之间正在就生成式 AI 时代的内容价值展开更广泛的辩论。Tollbit 将自己定位为内容匮乏的 AI 公司与愿意与他们达成重大许可协议的出版商之间的“媒人”。IT之家注:《福布斯》曾指

被指过度抓取内容后,AI 搜索公司 Perplexity 和出版社达成协议

感谢AI 搜索公司 Perplexity 在被指控过度抓取数据数周之后,公司推出了新的合作计划,向出版合作伙伴分享广告收入。AI在线注:Perplexity 的“出版商计划”已经招募了第一批合作伙伴,其中包括《时代》、《明镜周刊》、《财富》、《企业家》、《得克萨斯论坛报》和 Automattic(WordPress.com 参与其中,但不包括 Tumblr)等知名企业。根据该计划,当 Perplexity 在回应用户查询时刊登这些出版商的内容时,出版商将获得一定份额的广告收入。出版合作伙伴还将免费订阅 Perple