神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

都来玩这套。继 OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0 和 blueberry_1 力压 Flux.1、Ideogram v2、Midjourney v6.1 等知名模型,成为最新榜一榜二大哥。一些生成效果 be like,确实不错。不过这一次,未必是 OpenAI 跨界来搞事,背后公司更可能是打造了 Flux 的黑森林实验室。为啥?来看这组 PK。blueberry_0 生成的大胡子男人,和 Flux Pro 的几乎一模一样。有人

都来玩这套。继 OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。

在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0blueberry_1 力压 Flux.1、Ideogram v2、Midjourney v6.1 等知名模型,成为最新榜一榜二大哥。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

一些生成效果 be like,确实不错。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

不过这一次,未必是 OpenAI 跨界来搞事,背后公司更可能是打造了 Flux 的黑森林实验室

为啥?来看这组 PK。blueberry_0 生成的大胡子男人,和 Flux Pro 的几乎一模一样。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

有人猜测,难道是 Flux 的新版本?

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

我们实测时也发现了类似的情况,blueberry_1 在同一提示词下,生成图像从构图、光线到细节,与 Flux.1 [pro] 非常像。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

有网友就评论说,这真的很有意思。

公司在发布新模型之前先把它放在模型竞技平台上,大多数时候用户也能猜的出来它来自哪家公司。

……

这几乎是一种免费打广告的形式了。而且就是能吸引到目标用户。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

对提示词理解更精准

现在,在竞技场中随机匹配即可“偶遇”两个蓝莓模型。从实际生成效果中可以找寻出蓝莓模型的一些特点。

比如和 Midjourney v6.1 对比,blueberry_1 在细节和真实性上更好。

Midjourney 生成的人物手部不够自然,眼睛看着的是桌子而不是收银机,背带裤扣子也很奇怪。

相对而言,blueberry_1 整体更协调,光线更自然。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

和 Stable Diffusion XL 1.0 比较,写实性更好。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

和 FLUX.1 [dev] 对比,blueberry_0 对提示词的理解更精准,细节处理能力更强。

提示词中提到的山谷中充满神秘物种,FLUX.1 [dev] 只画了一个。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

但是也有一些情况,blueberry_0 的表现不算突出。觉得谁更好或许就见仁见智了。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

除此之外,还有网友发现蓝莓模型在生成图像中的文本上表现不佳。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

从数据上来看,两个蓝莓模型之间的差距并不大。从生成质量和速度两个维度评判,它们也都处于第一梯队。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

相对而言 blueberry_0 的生成质量更高一点点。如下结果是基于模型在竞技场中 PK10000 次以上后进行评定。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

生成速度上也是 blueberry_0 更快。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

竞技场胜率上,blueberry_0 排第一,Flux.1 [pro] 第二,blueberry_1 第三。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

网友:是 OpenAI 还是黑森林?

目前还无人认领“蓝莓”模型,网友们的猜测还在继续。

有人觉得它在细节上还有很多问题,不太可能是 OpenAI 的模型。

比如小屋出现了两个门把手。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

下图人物被挡住的胳膊和手有问题。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

但也有人说,最近 OpenAI 员工透露会有新模型,有可能是 OpenAI 悄悄发布。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

当然,也有人质疑“蓝莓”模型分数虚高,在一些情况下它的表现不及 Dall・E 3。

我感觉结果被操纵了,这样它们就能拿着这些成绩去给投资人看。“蓝莓”很明显就是参考了“草莓”的做法,而“草莓”模型就很可疑。

神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

你觉得呢?现在也可以去竞技场上实测“蓝莓”模型效果。

传送门:

https://artificialanalysis.ai/text-to-image/arena

参考链接:

[1]https://www.reddit.com/r/singularity/comments/1fpwuu7/a_new_mysterious_image_gen_model_called_blueberry/

[2]https://x.com/search?q=Blueberry%20Black%20Forest%20Labs&src=typed_query

本文来自微信公众号:量子位(ID:QbitAI),作者:明敏,原标题《神秘「蓝莓」登顶文生图竞技场,疑似 Flux.1 续作,网友:都来免费打广告了》

相关资讯

真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界

以后的视频生成领域,恐怕真的只有 OpenAI 的 Sora 和其他模型了。昨天,OpenAI 发布的首个文本生成视频模型 Sora 引爆了社区,其生成的长达 1 分钟的高清、流畅视频令人们惊叹不已,直呼「好莱坞的时代结束了」。仅仅一年时间,文本生成视频的效果迎来了质的飞跃。                              图源:,随着 Sora 加入这场视频生成领域的战争,受到冲击最大的是同类竞品模型,比如 Runway、Pika、SDV、谷歌和 Meta。看到 Sora 的生成效果之后,很多人认为,S

OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频

《华尔街日报》当地时间 13(今)日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑 Sora 生成的内容,“因为 AI 工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。当被问及 OpenAI 使用了哪些数据来训练 Sora 时,穆拉蒂没有给出非常具体的答案:“我不打算详谈所使

ChatGPT 网页 / 移动端整合文生图工具 DALL-E 3,加入图像局部修改功能

感谢今日凌晨,OpenAI 发文宣布:用户现在可以在 ChatGPT 中跨 Web、iOS 和 Android 使用 DALL-E 生成图像。除此之外,用户还可以通过添加、删除或调整图像中的元素来完善自己的 DALL-E 作品。用户可以通过选择工具选择图像的特定部分,并提供描述所需更改的文本提示。然后,DALL-E 将使用这些信息生成反映编辑内容的新版本图像。IT之家附官方演示视频: 前述 DALL-E 3 的编辑功能已经在本月初发布,但当时未被整合到 ChatGPT 中。OpenAI 表示通过引入该编辑器,进一步