科技媒体 404Media 披露的文件显示,英伟达收集了大量受版权包含的内容,用于训练人工智能(AI)。
该媒体披露的内部邮件、电子邮件、Slack 对话以及相关文件显示,英伟达从 YouTube 等多个来源收集视频素材,用于扩充训练 AI 的数据集。
该媒体披露的对话显示参与该项目的员工曾提出质疑,认为擅自使用 YouTube 视频以及研究目的编译的数据集,在法律层面可能会存在问题。
不过项目经理的回复是,这种收集模式已经获得了公司最高层的许可,可以使用这些内容训练 AI,并认为“完全符合版权法的文字描述和精神”。
一位英伟达员工透露,公司要求员工收集 YouTube、Netflix 等视频源的视频,用于训练英伟达的 Omniverse 3D 生成器、自动驾驶系统和“数字人类”(Digital Human)产品。
AI在线援引该媒体报道,该项目内部称其为 Cosmos 项目,为了规避 YouTube 的检测,英伟达使用具有轮换 IP 地址的虚拟机下载内容以避免被封禁。
英伟达员工写到:“我们在使用 AWS ,重新启动实例会分配一个新的公共 IP,所以到目前为止这不是问题。”
相关阅读:
《科技巨头被曝未经授权用 YouTube 内容训练 AI,苹果、英伟达在列》