最近几天,OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣,各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。AI在线还尝试了制作了《甄嬛传》的名场面(视频如下,制作方法参见《GPT-4o 整活!3 个小时、6 个镜头重现吉卜力版《甄嬛传》名场面》)。
其实,除了效果的大幅提升,这次 GPT-4o 更新还有一个值得关注的变化 —— 内容限制似乎比以前少了很多,很多公众人物 —— 如马斯克、特朗普 —— 现在都可以生成。而之前,模型会直接拒绝这类请求。
图源:https://x.com/morganlinton/status/1905081523768095049/photo/1
GPT-4o 生成的雷军相关图像。
为什么会发生这种变化?昨晚,OpenAI 的模型行为负责人 Joanne Jang 发文做出了解释。
她表示:
总之,以上种种考虑,加上 OpenAI 在精确评估技术方面的进步,促使他们采取了更宽松的政策。
Joanne Jang 还引用了同事 Jason Kwon 的一句话:「船在港口最安全;最安全的模型是拒绝一切的模型。但这不是船或模型的用途。 」
这也解释了为什么我们现在可以看到那么多吉卜力风格的图像,因为 GPT-4o 现在被允许模仿皮克斯、吉卜力等创意工作室的风格。
不过,OpenAI 现在仍限制模型模仿在世艺术家的个人风格,因为一旦放开,关于 AI 训练数据集中版权作品合理使用的争论又会变得棘手。
目前已经可以看到的是,GPT-4o 所带来的效果提升正在给广告、影视、游戏等行业带来新变化。
把 GPT-4o 和其他工具一起使用,往往会给人带来新的惊喜。
不过,OpenAI 并没有公布 GPT-4o 的图像处理技术细节,只提到采用了类似语言模型的自回归方法。所以,关于其背后技术,目前有很多猜测。
如果你有更合理的猜想,欢迎在评论区留言。
参考链接:
https://x.com/joannejang/status/1905341734563053979
https://techcrunch.com/2025/03/28/openai-peels-back-chatgpts-safeguards-around-image-creation/