OpenAI的新模型,竟被意外泄露了?
圣诞马拉松第四天,网友们从OpenAI研究员Karina Nguyen介绍Canvas功能的帖子里,发现了蛛丝马迹。
一个名叫「ChatGPT ε」的模型,现身了。
图片
有人猜测,这很有可能就是OpenAI的下一代模型「猎户座」。
图片
这个帖子很快引爆了社区,网友们经过更细致的研究,发现了新的亮点——
在Karina的浏览器收藏夹内,一个文件夹名为「Agents」,还有一个名为「Scientist Assistant」的标签页。
图片
眼看引起了轩然大波,Karina旋即将帖子删除了。
传闻中的猎户座,并不是GPT-5?
模型名称中的「ε」,正是猎户座中的那颗——参宿二(Alnilam)。
图片
说起Orion这个名字,我们都不陌生。
此前OpenAI酝酿许久的草莓模型(推理模型o1的原型),曾引出多篇猜测。
The Information的一篇报道中曾写道,草莓曾用来改进名为猎户座(Orion)的新模型。具体来说,Orion的预训练数据,正是由草莓模型生成的。
图片
当时,有人猜测猎户座就是下一代模型GPT-5,甚至GPT-6。
图片
而草莓的作用,就是帮OpenAI克服获取高质量数据的限制,从现实世界数据(如互联网获取的文本或图像)中训练新模型。
草莓可以帮Orion减少幻觉的产生,因为AI模型是从训练数据中学习的,所以它们看到的复杂推理的正确示例越多,就越好。
一个月前,The Information给出的全新曝料,也和所谓的「预训练Scaling Law撞墙说」对上了。
图片
据悉,猎户座相对于GPT-4的提升,要远小于GP4-3相对GPT-3的提升。因此,猎户座大概不会被命名为GPT-5。
图片
与之对应的,X上的「曝料哥」Tibor Blaho也透露说——
- 一些测试Orion的OpenAI员工说,在完成20%的训练后,它就达到了GPT-4级的性能,但质量的提高小于从GPT-3到GPT-4的飞跃,这表明随着高质量数据变得有限,传统的Scaling Law可能正在放缓。
- Orion的训练涉及来自GPT-4和推理模型等先前模型的AI生成数据,这可能会导致它重现旧模型的一些行为。
- OpenAI已经创建了一个「基础」团队,以开发新的方法,随着高质量数据供应的减少,
- OpenAI正在为明年初的计划发布完成Orion的安全测试,该测试可能会打破「GPT」命名惯例,以反映模型开发的变化
图片
此外,还有爆料称,OpenAI目前正在训练一个在预训练规模上介于GPT-4o和Orion之间的模型。
他们会先预训练一个「基础模型」,然后从中派生出两个模型:一个是传统的聊天模型,另一个是真正的推理模型。
而Orion的训练时间,也打破了1-2个月的常规,超过了3个月。
原因就在于,推理模型的「反馈循环」机制,使得这种情况发生了变化。
而Karina屏幕中透露的「Agents」,也让人有诸多联想。
图片
智能体是所有人一直期待的东西。而这次泄露是OpenAI有意的吗?
图片
有人猜测,Scientist Assistant可能是prompt摘要,agents folder看起来像传统的浏览器文件夹
网友热议:OpenAI明天又有大发布?
对于ChatGPT ε,有网友猜测道:「在同一张截图中,他们似乎正在运行某种epsilon模型——可能是GPT 4.5?」
图片
还有网友理性分析了引起讨论的标签页和文件夹,猜测「Scientist Assistant」可能是提示的摘要,而「agents」文件夹看起来像是一个传统的浏览器文件夹。
也就是说,这些可能和新功能新产品没什么关系。
图片
还有网友觉得无论如何,这都是「有意为之」。有可能就是一种营销手段。
图片
在这条Reddit帖子下,还有人总结了一下OpenAI的圣诞马拉松规律——
看起来他们现在似乎在遵循一种「A/B模式」,交替进行「大发布」和「小发布」。希望明天能迎来一个「大发布」。期待能有高级模式的视频功能!
图片
是的,有关视频功能的消息也已经初见端倪了。
ChatGPT的视觉语音模式要来了?
据悉,ChatGPT带有视觉功能的高级语音模式(以下简称「视觉语音模式」)即将向付费用户开放。
图片
60 Minutes最近在X上发布了一条将近3分钟的视频。视频中,OpenAI总裁Greg Brockman亲自向我们展示了ChatGPT视觉语音模式的能力。
图片
它可以通过实时视频看到视野范围内的人们正在做什么,并与他们进行实时的语音互动。
图片
视频中,ChatGPT实力变身全能老师,既当生物考官,又当数学老师——
它流畅地主持了一场解剖学测验,能够实时审阅黑板上的手绘答案并提供反馈;还写了一首三角形面积公式的押韵歌,并用英式口音唱了出来。
解剖学测验
在演示视频中,Brockman向ChatGPT发令:「你将对他进行测试,让他画出你想测试的任何身体部位,并让他标注出来。」
图片
指令发出后,Brockman的手机摄像头便一直对准黑板,ChatGPT开始主持这场对Anderson Cooper的测试。
图片
ChatGPT开考第一题:请标注心脏的位置!
Anderson在一个非常草率的人体示意图里,随便画了一个完全不圆的圈,标注出心脏的位置,GPT便成功地理解了他在做什么。
图片
接着,ChatGPT又请他画出大脑的位置,Anderson准确地画了出来。GPT毫不吝啬地称赞了他。
图片
然后,ChatGPT又出了一个题,让Anderson画出肝脏的位置。
图片
Anderson听到题目后感慨了一句「这有点难」,ChatGPT立马就捕捉到了他的轻微焦虑,并告诉他「别紧张」。整段对话流畅得像真人家教,唯一的区别是,GPT的声音有点机器人味儿。
图片
Anderson把肝脏画在了错误的一侧,ChatGPT礼貌地纠正了他。
图片
图片
最后,Brockman让GPT评价了一下这张图——
图片
计算三角形面积
视频中,大家还让GPT客串了一下数学老师。一开始,它准确地说出了计算三角形面积的公式。
图片
不过,当Khan故意指着三角形的边问「这里的高是这个4吗」,AI并没有发现错误。
图片
看来,平面几何题要比人体器官部位要难一些。
最后,Brockman还让GPT写了一首三角形面积公式的押韵歌,并让它用英式口音唱了出来。
参考资料:
https://x.com/kimmonismus/status/1866570298121916881
https://x.com/60Minutes/status/1865921920543186953