AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

随着 AI 巨头内卷加剧,很多工作可能会经历「从复杂操作到简单交互」的范式转移,大模型内卷,受伤可能是传统软件。

Grok 连夜上线图片编辑功能,继 Gemini 引爆图片编辑热潮后,动动嘴就能实现「证件照换西装」、「黑发变金发」等专业级 P 图效果。随着 AI 巨头内卷加剧,很多工作可能会经历「从复杂操作到简单交互」的范式转移,大模型内卷,受伤可能是传统软件。

Grok 连夜上线图片编辑功能。

昨晚,Grok 上线图片编辑功能,可以通过文字描述直接修改图片。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

比如你可以上传一张个人证件照,「动动嘴」让 Grok 给你 PS 一套全新的西服。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

看起来效果非常不错,Grok 还「体贴地」给你设计了四种不同风格,比如领带「带花纹」和「不带花纹」。

不过该功能目前应该还是在灰度测试中(作为 Premium 氪金用户的 Grok 主页暂时还没有编辑按钮)。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

Grok 手机 App 同步上线

Grok 也同步上线了 X 的手机 APP,你也可以在手机上体验图片编辑功能。

比如上传一张照片,让图片中人物的「黑发」变成「金发」。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

不过作为手机内部的 Grok 功能,目前同样是在灰度测试中。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

由于 Grok 灰色测试,目前全网还没有太多讨论。

不过从一些博主的测试作品来看,Grok 应该是对自己的效果很有信心。

比如这位有 6 万粉丝的 Borriss 博主,他的头像是一件「黑色高领毛衣」。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

但是经过 Grok 的 P 图后,换成了一套「西服」。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

「黑毛衣秒变西服」,AI 编辑的能力目前看起来效果并不赖。

其他陆续有用户放出了自己使用 Grok 编辑图片的效果,不过这次 Grok 犯了一个错误,把用户的脸也给换了。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

比如,可以将图片风格变成 Egon Shiele 的画作风格。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

或者是给马斯克加一顶帽子。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

大模型「内卷」,PS 受伤

Grok 这次「连夜」上传图片编辑功能,大概率是被 Google 的 Gemini2.0 火出圈的「动动嘴」PS 功能给刺激到了。

Google 发布 Gemini-2.0-flash 的 Experimantal 版本靠着简单的文本描述就能「P 图」的能力着实火了一把。

比如将两张照片 P 在一起还不违和,并且可以添加人物动作。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

或者,将白色风格的裙子换成红色,还能给人物打个领带。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

从 Gemin2.0 到 Grok 的图片编辑,能看出目前 SOTA 模型的「内卷」依然还在进行。

大模型也在「抢占」用户心智。

以后人们谈起 P 图,第一个想到也许不是 Photoshop 这种传统的图片编辑软件,而是 AI 赋能各种大模型功能。

从 P 图这件事情可以窥见一些苗头,AI 的发展很可能会带来一个很大的「范式转移」。

未来的很多工作会从「复杂操作」变成「简单交互」。

比如在图片编辑领域,Gemini 和 Grok 等大模型将持续降低图片编辑的技术门槛。

从原来需要专业软件、复杂步骤,到只需一句自然语言指令即可实现高质量图片编辑。

当然在目前的大模型 P 图效果依然停留在「可玩」的层面,专业的图片编辑还需要专业的 UI 工程师使用特定的软件才能完成。

不过 SOTA 模型的内卷依然没有结束。

正如 Alvaro Cintas 所说,为什么 OpenAI 还没有发布原生图像生成和编辑功能。

AI PS 卷起来了:谷歌 Gemini 动嘴 P 图,马斯克 Grok 上线图像编辑

也许快了,说不定哪天 ChatGPT 就放出编辑原生图片。

参考资料:

  • https://x.com/dr_cintas/status/1903112910735339984

本文来自微信公众号:新智元(ID:AI_era)

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上最聪明的人工智能。

Grok-3 内部测试曝光:xAI 欲打造“真理AI”,或将下周发布

据报道,虽然xAI官方尚未正式公布,但其最新模型 Grok-3 已短暂现身独立平台和X平台,并开启内部测试,预示着其正式发布已近在咫尺,有望于下周正式亮相。 有迹象表明,Grok-3的发布或将成为 AI 领域又一重大事件,有望成为目前最先进的 AI 模型。 据悉,Grok-3在回答问题方面的表现非常出色,在某些测试中甚至超越了 OpenAI 的 o1和 DeepSeek R1等领先模型。

​马斯克的xAI计划扩招数千名 “AI导师” 以提升Grok能力

埃隆・马斯克的人工智能公司 xAI 正在加大招聘力度,计划在今年增加数千名 “AI 导师”。 目前,该公司已经雇佣了900多名导师,主要负责训练其聊天机器人 Grok。 这一举措旨在帮助 xAI 在与 OpenAI、Meta 和谷歌的人工智能竞争中占据优势。