研究:反复使用 AI 生成的内容来训练 AI 可造成“模型崩溃”

感谢当地时间 9 月 4 日,据《福布斯》报道,牛津大学的伊利亚・舒梅洛夫博士和他的团队发现,当生成式 AI 软件仅依赖于由 AI 生成的内容时,回答的质量开始恶化。这项研究已经发表在《自然》杂志上。在最初的两次查询后,答案逐渐偏离准确性,到第五次时,质量显著下降,到了第九次连续查询时,回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”,即 AI 在不断污染自己的训练集后,输出的内容逐渐偏离现实,最终变得毫无价值。舒梅洛夫表示:“令人惊讶的是,模型崩溃发生得如此迅速且难
感谢当地时间 9 月 4 日,据《福布斯》报道,牛津大学的伊利亚・舒梅洛夫博士和他的团队发现,当生成式 AI 软件仅依赖于由 AI 生成的内容时,回答的质量开始恶化。这项研究已经发表在《自然》杂志上。

在最初的两次查询后,答案逐渐偏离准确性,到第五次时,质量显著下降,到了第九次连续查询时,回答已完全退化为无意义的胡言乱语。研究人员将这种生成式 AI 内容的循环过度使用称为“模型崩溃”,即 AI 在不断污染自己的训练集后,输出的内容逐渐偏离现实,最终变得毫无价值。

被大量信息吓得头晕目眩、表情痛苦的机器人

舒梅洛夫表示:“令人惊讶的是,模型崩溃发生得如此迅速且难以察觉。最初,它会影响到少数数据 —— 那些代表性不足的数据。接着,它会影响输出的多样性,导致差异性减少。有时,你会观察到对多数数据的微小改进,但这种改进掩盖了少数数据表现的恶化。模型崩溃可能带来严重后果。”

研究人员通过一种方法确定了“模型崩溃”现象的存在:使用一个预训练的 AI 驱动的维基百科,然后让 AI 模型基于自己生成的内容进行更新。受污染数据的影响逐渐导致原本的训练集被侵蚀,输出的信息也随之变得难以理解。例如,在第九次查询循环后,研究中的维基百科条目从关于 14 世纪英国教堂尖顶的内容滑稽地变成了一篇关于各种颜色的短尾兔子的论文。

报道称,根据亚马逊网络服务(Amazon Web Services)团队在 6 月发布的另一项研究,大约 57% 的网络文本都经过了 AI 算法的翻译。如果互联网上的人类生成数据迅速被 AI 过滤内容覆盖,且舒梅洛夫的研究发现属实,那么 AI 可能正在“自我毁灭”—— 并同时“毁灭”互联网。

研究得出结论,要实现 AI 的长期可持续发展,唯一方法是确保其能够访问现有的非 AI 生成内容,并持续引入新的人工生成内容。

AI在线附研究链接:

AI models collapse when trained on recursively generated data

相关资讯

抖音:已掌握部分黑产团伙不当使用 AI 生成虚拟人物用于犯罪的线索,将报警打击

去年,抖音发布《关于人工智能生成内容的平台规范暨行业倡议》,明确平台不鼓励利用 AI 生成虚拟人物进行低质创作,将严格处罚违规使用 AI 生成虚拟人物发布违背科学常识、弄虚作假、造谣传谣的内容。抖音安全中心今日发布公告,近期平台发现,站内仍有不当使用 AI 技术生成虚拟人物发布内容的账号,平台进行了严厉处置。其中典型行为包括:1、生成境外虚假人设,消费爱国心理、博取关注。用虚假外国人的形象,以想嫁给中国、想到中国生活、评价社会事件等言论博取眼球。2、生成俊男美女虚假形象,骗取互动,交友导流。直接称用户为“你”“娘”

海外写作平台 Medium 5 月起禁止发布完全由 AI 生成的付费类文章

据海外知名写作平台 Medium 官方新闻稿,从 5 月 1 日起,该平台将禁止发布完全由 AI 生成的付费文章内容。Medium 平台声称,自家是“供人类讲故事的平台”,而不是给“AI 写作机器竞技大擂台”,虽然 AI 能够帮助某些人更清晰地写作,或者辅助创作者以自己生疏的第二语言撰写内容,但全然由 AI 撰写的内容并不可取,从 2024 年 5 月 1 日起,禁止用户发布任何由 AI 生成的付费内容。IT之家注意到,如果相关作者在 5 月 1 日以后继续发布由 AI 生成的付费内容,用户有权进行举报,相关作者将

谷歌 Play 商店宣布整顿生成式 AI 类 App:必须限制不当内容传播

感谢当地时间周四,谷歌针对 AI 类应用程序更新了指导方针,目标是减少“不适当的”和“被禁止的”内容。谷歌在新的政策中指出,提供生成式 AI 功能的应用必须防止生成受限制的内容,包括色情内容、暴力等,并要求应用对其 AI 模型进行“严格测试”。这些规则适用于多种应用程序,IT之家简要汇总如下:以文本、语音和图像提示输入的任何组合,经由生成式 AI 产生内容的 App。聊天机器人类、图像生成类(文生图、音生图、图生图)、语音及视频生成类 App。不适用于“仅仅承载”AI 内容的 App,或将 AI 用作生产力工具的