因使用受版权保护书籍训练 AI 平台，英伟达被三名作者起诉

作者：清源

2024-03-11 04:46

感谢据美国福克斯电视台北京时间今日报道，科技巨头英伟达已被三名作者起诉，因为英伟达在训练其 AI 平台 NeMo 时，未经许可使用了他们受到版权保护的书籍。三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称，自己的作品被收录在一个包含约 196640 本书籍的数据集内，这些书籍帮助训练 NeMo 模拟普通书面语言，但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。（IT之家注：该数据集原本被托管在 Hugging Face 网站上）作者们在 3 月 8 日晚提交

感谢据美国福克斯电视台北京时间今日报道，科技巨头英伟达已被三名作者起诉，因为英伟达在训练其 AI 平台 NeMo 时，未经许可使用了他们受到版权保护的书籍。

三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称，自己的作品被收录在一个包含约 196640 本书籍的数据集内，这些书籍帮助训练 NeMo 模拟普通书面语言，但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。（IT之家注：该数据集原本被托管在 Hugging Face 网站上）

作者们在 3 月 8 日晚提交给旧金山联邦法院的一份集体诉讼提案中表示，英伟达“承认”其在该数据集上训练了 NeMo，侵犯了他们的版权。

报道称，NeMo 平台的大语言模型在过去三年中，训练工作受益于这些受版权保护的作品。诉讼涉及的作品包括三名作者在 2008 年、2019 年、2007 年出版的长篇小说，包含在一个名为“The Pile”的数据中，这一数据集又包含名为“Books3”的书籍合集。

当前科技公司在训练模型时使用受版权保护内容的诉讼案与日俱增，在此之前，《纽约时报》起诉微软及其合作方 OpenAI 未经许可使用其文章训练大型语言模型，并指控其侵犯版权。

因使用受版权保护书籍训练 AI 平台，英伟达被三名作者起诉

相关资讯

英伟达 Mistral AI 联袂出击！120 亿小模型王者强势登场，碾压 Llama 3 单张 4090 可跑

英伟达发布 80 亿参数新 AI 模型：精度、效率高，可在 RTX 工作站上部署

索尼音乐集团警告 AI 公司不得使用自家资产进行模型训练