因使用受版权保护书籍训练 AI 平台,英伟达被三名作者起诉

感谢据美国福克斯电视台北京时间今日报道,科技巨头英伟达已被三名作者起诉,因为英伟达在训练其 AI 平台 NeMo 时,未经许可使用了他们受到版权保护的书籍。三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称,自己的作品被收录在一个包含约 196640 本书籍的数据集内,这些书籍帮助训练 NeMo 模拟普通书面语言,但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)作者们在 3 月 8 日晚提交
感谢据美国福克斯电视台北京时间今日报道,科技巨头英伟达已被三名作者起诉,因为英伟达在训练其 AI 平台 NeMo 时,未经许可使用了他们受到版权保护的书籍。

三名作者 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称,自己的作品被收录在一个包含约 196640 本书籍的数据集内,这些书籍帮助训练 NeMo 模拟普通书面语言,但这个数据集因“被举报侵犯版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)

作者们在 3 月 8 日晚提交给旧金山联邦法院的一份集体诉讼提案中表示,英伟达“承认”其在该数据集上训练了 NeMo,侵犯了他们的版权。

报道称,NeMo 平台的大语言模型在过去三年中,训练工作受益于这些受版权保护的作品。诉讼涉及的作品包括三名作者在 2008 年、2019 年、2007 年出版的长篇小说,包含在一个名为“The Pile”的数据中,这一数据集又包含名为“Books3”的书籍合集。

当前科技公司在训练模型时使用受版权保护内容的诉讼案与日俱增,在此之前,《纽约时报》起诉微软及其合作方 OpenAI 未经许可使用其文章训练大型语言模型,并指控其侵犯版权。

相关资讯

英伟达 Mistral AI 联袂出击!120 亿小模型王者强势登场,碾压 Llama 3 单张 4090 可跑

GPT-4o mini 头把交椅还未坐热,Mistral AI 联手英伟达发布 12B 参数小模型 Mistral Nemo,性能赶超 Gemma 2 9B 和 Llama 3 8B。小模型,成为本周的 AI 爆点。先是 HuggingFace 推出了小模型 SmoLLM;OpenAI 直接杀入小模型战场,发布了 GPT-4o mini。GPT-4o mini 发布同天,欧洲最强 AI 初创公司 Mistral 立马发布旗下最新最强小模型 ——Mistral NeMo。Mistral NeMo 由 Mistral

英伟达发布 80 亿参数新 AI 模型:精度、效率高,可在 RTX 工作站上部署

英伟达于 8 月 21 日发布博文,发布了 Mistral-NeMo-Minitron 8B 小语言 AI 模型,具备精度高、计算效率高等优点,可在 GPU 加速的数据中心、云和工作站上运行模型。英伟达携手 Mistral AI 上月发布开源 Mistral NeMo 12B 模型,在此基础上英伟达再次推出更小的 Mistral-NeMo-Minitron 8B 模型,共 80 亿个参数,可以在搭载英伟达 RTX 显卡的工作站上运行。英伟达表示通过宽度剪枝(width-pruning)Mistral NeMo 12

索尼音乐集团警告 AI 公司不得使用自家资产进行模型训练

感谢根据彭博社的一份新报告,索尼音乐集团正在通知各大 AI 公司不得“未经授权使用公司旗下的资产进行模型训练”。IT之家获悉,索尼音乐目前已经向 700 多家公司发送了信件,以保护其知识产权,索尼提到,任何 AI 公司未经明确许可,不得使用索尼旗下的专辑封面艺术、音乐作品和歌词等内容。在 AI 模型的训练上,版权一直是一项令人“头大”的问题,如今业界举着牌子声称“某某模型侵犯原始作者版权”的事件已经屡见不鲜,参考IT之家此前报道,今年 4 月美国众议员 Adam Schiff 提出了一项新的法案,建议 AI 公司应