GPT-4o 的图像生成功能刚刚发布就直接开始摧毁传统行业,甚至让 OpenAI 的 CEO 山姆·奥特曼(Sam Altman)都直呼:“我也看不懂眼前发生的一切!”
图片
传统的设计软件,比如 Photoshop,现在可真是如临大敌了。
一、图像融合的能力彻底超越传统工具
来看一个让人震惊的图像融合实例:
图片
传统的 Photoshop 顶多就是简单地将人物图层叠加到背景图上,对光影和角度的细节通常还要手动调整。但 GPT-4o 呢?
它对图像的理解已经达到前所未有的深度——看看下面的对比图:
- 前(before):房间单独的背景图 + 女孩单独的人物图。
- 后(after):合成的图片中,房间和人物的光线、角度自然匹配,完全不像简单拼贴,而是像本来就在一起。
你注意到细节了吗?人物和房间的3D角度与光线完全融合,GPT-4o 不再只是简单地拼接或调用 DALL-E 后台了,而是真正意义上的“理解”图片本身!
二、创造力爆表,理解 prompt 的能力前所未见
再看看这张图:
图片
你觉得训练数据里可能有这种独特而精确的图像吗?显然不可能!
过去有些人认为 AI 图片生成不过是“复制”或“随机拼贴”——而 GPT-4o 彻底打破了这种误解。它对用户 prompt 的理解精准得让人难以置信。
图片
举个简单例子:它现在甚至能完美绘制一杯真实感爆棚的红酒。
图片
三、文字的理解和生成能力质的飞跃
下面这个例子简直让人目瞪口呆:
图片
- 图像理解的惊艳:GPT-4o 能准确地在完全不同的绘画风格之间转换图像,并保留面部表情。
- 上下文理解的突破:注意原漫画中第四个女孩举手指向服务员的动作,GPT-4o 在新风格里完美还原了这个动作,甚至比原图更准确地表达了“点单”的情境! 你甚至可以要求它精确还原原来的手势,它也完全能够做到。
- 文字生成的巨大进步:传统 AI 图片生成工具对文字生成一直都非常吃力,而 GPT-4o 轻松复刻了对话气泡中的文本,甚至自动给最后一个女孩加了个感叹号,更贴合她惊讶的表情与情景氛围。
四、图文一体生成,设计师的福音 🎨
图片
另外,现在 GPT-4o 也能轻松地将文字直接融合进图像中,对于海报、社交媒体图文设计等场景简直完美:
如果你不认为这已经彻底颠覆了传统的图像编辑与平面设计工具(比如 Photoshop 和 Illustrator),那你可真得给我解释一下,到底什么才叫“颠覆”。
图片
五、网络疯传,人人抢着玩
难怪这些天你在社交媒体上总能刷到大量类似“吉卜力动画风格”的精美图片,这已经迅速成为一种新潮流:
图片
目前 OpenAI 仅为付费用户开放了 GPT-4o 图像功能,免费用户还需稍等一段时间,因为需要扩展技术规模,确保所有人都能获得最佳体验。
🎖 总结:一个新时代的开启
毫无疑问,GPT-4o 的图像生成功能标志着人工智能生成图像领域的巨大飞跃,极大地威胁了传统设计工具的市场地位。
更让人兴奋的是,这只是个开始——AI 的下一波创新浪潮已经蓄势待发,你准备好了吗?