被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略

最近几天,OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣,各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。 AI在线还尝试了制作了《甄嬛传》的名场面(视频如下,制作方法参见《GPT-4o 整活! 3 个小时、6 个镜头重现吉卜力版《甄嬛传》名场面》)。

最近几天,OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣,各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。AI在线还尝试了制作了《甄嬛传》的名场面(视频如下,制作方法参见《GPT-4o 整活!3 个小时、6 个镜头重现吉卜力版《甄嬛传》名场面》)。被吉卜力刷屏的背后:OpenAI模型行为负责人揭秘GPT-4o新生成策略

其实,除了效果的大幅提升,这次 GPT-4o 更新还有一个值得关注的变化 —— 内容限制似乎比以前少了很多,很多公众人物 —— 如马斯克、特朗普 —— 现在都可以生成。而之前,模型会直接拒绝这类请求。

image.png

                                    图源:https://x.com/morganlinton/status/1905081523768095049/photo/1

image.png

                                                                GPT-4o 生成的雷军相关图像。

为什么会发生这种变化?昨晚,OpenAI 的模型行为负责人 Joanne Jang 发文做出了解释。

image.png

她表示:

总之,以上种种考虑,加上 OpenAI 在精确评估技术方面的进步,促使他们采取了更宽松的政策。

Joanne Jang 还引用了同事 Jason Kwon 的一句话:「船在港口最安全;最安全的模型是拒绝一切的模型。但这不是船或模型的用途。 」 

这也解释了为什么我们现在可以看到那么多吉卜力风格的图像,因为 GPT-4o 现在被允许模仿皮克斯、吉卜力等创意工作室的风格。

不过,OpenAI 现在仍限制模型模仿在世艺术家的个人风格,因为一旦放开,关于 AI 训练数据集中版权作品合理使用的争论又会变得棘手。

目前已经可以看到的是,GPT-4o 所带来的效果提升正在给广告、影视、游戏等行业带来新变化。

image.png

image.png

把 GPT-4o 和其他工具一起使用,往往会给人带来新的惊喜。

image.png

不过,OpenAI 并没有公布 GPT-4o 的图像处理技术细节,只提到采用了类似语言模型的自回归方法。所以,关于其背后技术,目前有很多猜测。

image.png

image.png

image.png

如果你有更合理的猜想,欢迎在评论区留言。

参考链接:

https://x.com/joannejang/status/1905341734563053979

https://techcrunch.com/2025/03/28/openai-peels-back-chatgpts-safeguards-around-image-creation/

相关资讯

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道,知情人士透露微软工程师团队正加速部署服务器资源,为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。 尽管OpenAI CEO山姆·阿尔特曼(Sam Altman)近期确认GPT-4.5将在几周内亮相,但微软内部预计最快下周即可完成新模型的托管部署,这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。 代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。

腾讯云TI平台上架DeepSeek系列模型 支持免费体验和一键部署

近日,腾讯云TI平台宣布正式上架备受瞩目的DeepSeek系列模型,包括参数量达到671B的“满血版”V3和R1原版模型,以及基于DeepSeek-R1蒸馏得到的系列模型,参数规模从70B到1.5B不等。 这一举措为开发者提供了强大的AI工具支持,进一步推动了大模型技术的普及和应用。 DeepSeek系列模型以其卓越的性能在全球范围内获得了广泛关注。

AI"自我对抗"玩法火了 一句话让AI破防

最近,一场别开生面的AI对决正在互联网上演。 从唇枪舌战到国际象棋对弈,AI之间的较量不仅展现了它们的语言能力和思维方式,更成为当下最热门的流量话题。 近期,DeepSeek与GPT的对话视频在B站引发广泛关注,播放量突破300万,互动量超50万。