比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

今天我们提到庞大言语模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到庞大言语模型,ChatGPT 并不是第一个。一年前,也就是 OpenAI 宣布 ChatGPT 的前两周,Meta 宣布了一个名为 Galactica 的试用版模型。作为一个庞大言语模型,Galactica 是在大量的论文、参考资料、知识库和许多其他来源的迷信语料库上进行训练的,包括超过 4800 万篇论文、教科书和讲义、数百万种化合物和蛋白质知识、迷信网站

今天我们提到庞大言语模型(LLM),第一个想到的就是 OpenAI 的 ChatGPT。一年来,ChatGPT 因其强大的性能,广泛的应用前景而爆火出圈。但谈到庞大言语模型,ChatGPT 并不是第一个。

一年前,也就是 OpenAI 宣布 ChatGPT 的前两周,Meta 宣布了一个名为 Galactica 的试用版模型。作为一个庞大言语模型,Galactica 是在大量的论文、参考资料、知识库和许多其他来源的迷信语料库上进行训练的,包括超过 4800 万篇论文、教科书和讲义、数百万种化合物和蛋白质知识、迷信网站、百科全书等。

彼时,Meta 声称 Galactica 能够总结学术文献、解决数学成绩、生成 Wiki 文章、编写迷信代码,甚至可以执行涉及化学公式和蛋白质序列的多模态任务。

然而,上线不到三天,Galactica 就迅速下架了,原因是 Galactica 生成的文本不严谨,不负责任地胡编乱造。

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

当时,「幻觉」这个词还没有成为机器学习领域的主流词汇,但 Galactica 可以说是因为严重的幻觉成绩而被下架。

图灵奖得主、Meta 首席迷信家 Yann LeCun 为 Galactica 的下架感到非常遗憾,并宣布推文:「再也不能用它来找乐子了。你们都开心了吗?」显然,LeCun 认为大家对 Galactica 的指责有些过分。

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

有趣的是,就在同一周,关于 GPT-4 即将宣布的传言不胫而走。11 月 30 日,当许多 AI 钻研人员正在 NeurIPS 上讨论 OpenAI 可能要推出 GPT-4 时,ChatGPT 突然就宣布了。

当然, ChatGPT 很快也被发现有幻觉成绩,这与 Galactica 和其他生成式 AI 一样。ChatGPT 会「滔滔不绝」,自信满满,但它的回答又是似是而非的。但值得注意的是,OpenAI 在宣布 ChatGPT 的博客中明确指出了它这一弱点,并解释称:「解决这一成绩极具挑战性。」

接下来的事情大家都看到了,ChatGPT 迅速成为 LLM 「顶流」。在过去的一年里,它已经成为有史以来增长最快的服务之一。推出两个月后,月活用户就突破了 1 亿,现在每周用户也有约 1 亿。

现在,Galactica 的故事又一次被提起。外媒 VentureBeat 资深撰稿人 Sharon Goldman 宣布了一篇新文章,讲述了 Galactica 给 Meta 带来的经验教育。

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

             文章链接:https://venturebeat.com/ai/what-meta-learned-from-galactica-the-doomed-model-launched-two-weeks-before-chatgpt/

关于 Galactica,Meta 公司 AI 钻研副总裁 Joelle Pineau 在采访时向 VentureBeat 讲道:「我们学到了很多好的经验。这是一个很好的模型,我仍然收到很多人想要这个模型的请求。」

「人们对产品会有一种期望,就像是你想要用它来撰写论文。但这并不是我们的初衷。」Pineau 强调说:「Galactica 从来就不是一个产品,而是一个钻研项目。我们是抱着这样的目的宣布的,我们做了一个低调的宣布,把它放在 GitHub 上,钻研人员在推特上宣布了它,但是期望与钻研之间的差距太大了。」

当时的人们显然对模型幻觉十分惊讶,而幻觉这件事在一年后将变得稀松平常。其实,Galactica 的幻觉水平实际上低于其他模型,因为它是根据迷信文献进行微调的。

此外,在 VentureBeat 的文章中,作者 Sharon Goldman 也提到:令人庆幸的是,Galactica 的教育给 Llama 的宣布上了一课。

Meta 公司撤下了 Galactica 演示版,以确保人们不会被误导使用它。Pineau 表示:「如果让我今天来做这件事,我们会对宣布进行管理。」当时,Meta 很可能错误地估计了人们对 Galactica 的期待,但 「我们已经将从中吸取的教育融入到下一代模型中了。」

Meta 的下一代庞大言语模型就是 LLaMA,它于 2023 年 2 月在 AI 钻研领域掀起了一场风暴,随后在 7 月推出了商用的 LLaMA 2,8 月又推出了 Code LLaMA。随着 LLaMA 成为第一个主要的免费开源 LLM,开源 AI 开始崭露头角,并引发了一场热火朝天的讨论。

LLaMA 于 2 月 24 日宣布时,Meta 非常谨慎。Yann LeCun 在分享 LLaMA 论文时表示:「Meta 致力于开放钻研,将在 GPL v3 许可证下向钻研社区宣布所有模型。」

当被问及为什么钻研人员必须填写表格才能访问 LLaMA 时,LeCun 回答道:「因为上次我们向所有人提供 LLM( 旨在帮助迷信家撰写迷信论文的 Galactica)时,人们对我们嗤之以鼻,并告诉我们这将破坏社会结构。」

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

看起来,LeCun 对 Galactica 的下架一直抱有「怨气」。

如今,LeCun 也是马上就在推特上转发了 Sharon Goldman 这篇文章,说道:「舆论称我们现在所说的 LLM 幻觉会摧毁迷信出版系统。结果,一个对迷信家来说非常有用的工具被毁了。」最后他还表示:「以人工智能道德为幌子的误导性观点可能会适得其反。」这不得不让人联想到最近 LeCun 与另一位图灵奖得主 Geoffrey Hinton 关于「AI 监管」的辩论。

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

Galactica 的第一作者 Ross Taylor 也在推特上发文表示:Galactica 在宣布时因人手稀缺而没有对基础模型进行充分的检查,这导致了一些成绩。他们原本希望通过公开演示来收集迷信查询的数据,但这反而引起了误解和批评。但他们的钻研仍然是有价值的,并且从这次经历中学到的教育已经用到了后续的 LLaMA 2 项目中。

比ChatGPT早发两周,被喷下线的Galactica成了LeCun最大的意难平

LeCun 更是用开源应「尽早宣布,经常宣布(release early, release often)」为 Galactica 再鸣不平。

无论如何,掀起大模型浪潮的是 OpenAI 的 ChatGPT,在开源领域实现突破的是 LLaMA,Galactica 的故事已成过去。

参考链接:https://venturebeat.com/ai/what-meta-learned-from-galactica-the-doomed-model-launched-two-weeks-before-chatgpt/

给TA打赏
共{{data.count}}人
人已打赏
应用

幻觉率直降40%,中国电信千亿参数「星斗大模型」炸场,业界首提缓解多轮幻觉解决方案

2023-11-15 11:23:00

应用

超详细!Stable Diffusion 卡通IP调整姿态保姆级教程

2023-11-16 7:12:53

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索