感谢据美国福克斯电视台北京时间今日报道,科技巨头英伟达已被三名作家告状,因为英伟达在训练其 AI 平台 NeMo 时,未经许可利用了他们受到版权保护的书本。三名作家 Brian Keene、Abdi Nazemian 和 Stewart O'Nan 声称,自己的作品被收录在一个包罗约 196640 本书本的数据集内,这些书本帮助训练 NeMo 模拟普通书面说话,但这个数据集因“被举报入侵版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)作家们在 3 月 8 日晚提交
感谢据美国福克斯电视台北京时间今日报道,科技巨头英伟达已被三名作家告状,因为英伟达在训练其 AI 平台 NeMo 时,未经许可利用了他们受到版权保护的书本。
三名作家 Brian Keene、Abdi Nazemian 和 Stewart O’Nan 声称,自己的作品被收录在一个包罗约 196640 本书本的数据集内,这些书本帮助训练 NeMo 模拟普通书面说话,但这个数据集因“被举报入侵版权”在去年 10 月被撤下。(IT之家注:该数据集原本被托管在 Hugging Face 网站上)
作家们在 3 月 8 日晚提交给旧金山联邦法院的一份集体诉讼提案中表示,英伟达“承认”其在该数据集上训练了 NeMo,入侵了他们的版权。
报道称,NeMo 平台的大说话模型在过去三年中,训练工作受益于这些受版权保护的作品。诉讼涉及的作品包括三名作家在 2008 年、2019 年、2007 年出版的长篇小说,包罗在一个名为“The Pile”的数据中,这一数据集又包罗名为“Books3”的书本合集。
当前科技公司在训练模型时利用受版权保护内容的诉讼案与日俱增,在此之前,《纽约时报》告状微软及其合作方 OpenAI 未经许可利用其文章训练大型说话模型,并指控其入侵版权。