ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近,谷歌一口气对 AI 模型能力做了一次大升级,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,这个模型对设计师来说,实用性很强。 更多新模型的介绍:. 被低估的谷歌?

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

最近,谷歌一口气对 AI 模型能力做了一次大升级,其中最吸引我的是 Gemini 2.0 Flash (Image Generation) ,这个模型对设计师来说,实用性很强。

更多新模型的介绍:

被低估的谷歌?聊聊Gemini 2.0最近3个超酷的新功能

Google 最近的动作真的多。

阅读文章 >

然后谷歌这个模型也开放了 API,可以很容易把它接入到 ComfyUI 中,我自己试用后很兴奋,忍不住在我的社群里跟大家分享,太惊喜了!

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

可能有朋友还不知道 Gemini 2.0 Flash 是个啥模型?能做什么?

我先简单总结下:Gemini 2.0 Flash 最早是在 2024 年 12 月 12 号发布的,那时候只是作为一个实验性的发布,并不对我们普通用户开放。经过几个月的测试后,在 3 月 12 号已经测试通过,正式全面向所有人开放了。它能通过自然语言生成或编辑图片,和 ComfyUI 有点类似,可控性很好。

可控性好就意味着在工作中将会变得实用,前段时间还跟腾讯的同事聊天,发现他们现在都已经要求团队的人必须会 ComfyUI 了,招人也是有这个要求,能通过搭建工作流解决工作问题,对这块很是重视。

模型怎么用?

它的使用很简单,打开官方这个链接 :https://aistudio.google.com/prompts/new_chat

然后选择 Gemini 2.0 Flash (Image Generation) Experimental 这个模型

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

在主页上,它给了 3 个示例,可以分别点击这几个示例,就大概知道怎么用了。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

先快速说下官方给的这 3 个基础用法示例

1. 图片编辑

用最直白的话就能对图片进行修改。

这里的提示词是:给牛角面包撒点巧克力。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

我们还可以继续用对话对图片进行编辑,比如“给这张图上面加点奶油”,如果觉得不大够,还可以“奶油再多一些”。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

基本上它的生成就是指哪打哪,不会把原图搞乱,这就跟咱们在 PS 里修图挺像的了,非常实用,AI 改图最怕的就是改完之后原图搞不像了,可控性至关重要。下次你老板再戳你屏幕的时候,直接让他把意见打成文字,一分钟给他改好。

2. 创建图片绘本

可以让它帮你写一段故事脚本,并且每一个场景配上一张图,且每个片段的图是连贯的。

这里的提示词官方给了示例:生成一个故事,关于一只小山羊在一个农场冒险的故事,每个场景对应生成一张配图。

点示例后,它很快就生成了 9 个故事场景,然后每个场景都会生成一张统一主角,统一风格的配图。效果惊人!

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

以后绘本生意估计不好做了。家里小孩想看绘本,咱们自己都能很快出一套,打印出来就能做成册了。亲手做出来给孩子的绘本,成就感肯定不一样,言传身教。

3. 生成生日卡片

它还能通过最直白的对话,生成一张海报,文字内容我看了下完全正确,直接就能发给朋友了。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

好,官方的几个示例都特别简单,自己去试下绝对能明白,没什么好说的。下面我要讲下它的进阶用法,我感觉这才是大招!这也是这个模型让我觉得最有用的地方,它提供了 API 的方式,可以随便免费插入到其他应用中,比如 ComfyUI。

我经常跟社群的朋友们说,一定要学会 ComfyUI,因为它真的能帮我们解决实际项目问题,但很多朋友的电脑配置带不动 ComfyUI,有心无力,现在有了谷歌的这个新模型 API,只要你能在电脑上启动 ComfyUI,你的显卡多差都无所谓,一样能通过 ComfyUI 工作流快速生成想要的效果。

具体在 ComfyUI 里怎么接入这个模型?然后又有哪些进阶玩法呢?咱们继续说。

先启动 ComfyUI,如果你还不知道怎么安装,可以看这篇:

喂饭级教程!ComfyUI本地部署超详细指南

大家好,欢迎来到本节的 ComfyUI 课程!

阅读文章 >

打开插件安装器,搜 Gemini-API ( https://github.com/tatookan/ComfyUI_ssl_gemini_EXP ),注意看最新更新的时间,装完之后重启 ComfyUI,它就会生效。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

上面是连单张图的,如果你还想要通过 2 张图合并生成,可以装上这个节点:ComfyUI Gemini Flash ( https://github.com/ShmuelRonen/ComfyUI_Gemini_Flash )节点。

然后双击 ComfyUI 空白处,搜索 gemini,把这个节点调出来

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

前面连上你想调的图片,后面接上图片预览,就能用起来了。

但在这之前,面板上还有一个 api_key 需要填,这个从哪弄到呢?

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

还记得前面打开的 google AI studio 吗?怕你忘了,地址再说一次:https://aistudio.google.com/prompts

左上角有一个蓝色按钮,“Get API key” 。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

点中间的创建 API 秘钥

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

创建完之后,把这个秘钥复制上

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

贴到 ComfyUI 中刚才创建的节点里

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

到这配置就完成了,没任何难度。

当结合 ComfyUI 后,它能玩的东西就非常多了。相当于把之前可能需要一堆节点才能完成的事,现在用谷歌一个节点也能做。我给大家示例一些,其他的大家再发挥下想象力,把你想到的有意思的用途放在评论区。

① 给图片去水印

本来我想找一张车的白模给大家演示,但找到的图是带水印的,那就先去掉水印。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:把这张图中的水印去掉,只保留车。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

修改结果,发现它不仅把水印给去掉了,还把位置和光影移动到了更好的位置,图片的清晰度和质量都帮忙提升了。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

② 上色+换背景

有了高质量白模图,咱们继续让这张图变得更真实。

给这张图上个材质,换个环境

提示词:给图中的车上个色,让它看起来更真实好看,车开在户外的公路上,路两边有山林,保留车的角度和特征。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

结果还行吧,基本特征算是继承了下来。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

③ 换衣服

给车上完色,咱们接着来做点更实用的事,给模特换衣服,这在电商领域经常用到。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:给这位美女换一件白色衬衫

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

换完衣服,动作稍微有些变化,但画面的背景,人物的其他特征基本上得到了保留。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

④ 给一件衣服做一张广告图

假如我们有一件衣服需要把它做成一张宣传图。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:给这件衣服添加一个小孩子模特,做出一张电商广告图,保持衣服的一致性

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

⑤ 给人物换个表情

以前在 ComfyUI 中换表情,调起来挺麻烦的,现在接入这个 API 后,换表情不要太容易,而且效果还不错,人物特征保持的特别好。

比如我拿哪吒来尝试,让他张嘴笑起来。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

提示词:让图片中的人物大笑起来,嘴巴需要打开,保持人物的特征不变。

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

修改结果

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

上面这些操作,你也可以不用 ComfyUI,直接用谷歌的那个对话框也能搞定,只不过在 ComfyUI 里有批量或者其他更多操作的时候,会更方便一些。

AI 的发展,其实一直都在降低技术学习成本,ComfyUI 学习对很多人来说太复杂,我就知道早晚会把它的难度打下来,只是没想到这么快。

果然在 AI 世界,每天都在发生巨变,我们要做的就是保持关注,积极接纳,多用多学习。一起适应这个正在发生巨变的世界。

欢迎关注作者的微信公众号:「彩云译设计」

ComfyUI 难度骤降一倍!揭秘谷歌Gemini 2.0 Flash的史诗级更新

相关资讯

ComfyUI神级插件!在PS中轻松实现 AI 图像生成、放大和重绘

大家好,这里是和你们一起探索 AI 的花生~ 今天为大家推荐一款我最近发现的非常厉害的 ComfyUI 插件 comfyui-photoshop,它由程序员 Nami 独立开发,将 ComfyUI 做为后端接入 Ps 中,借助其强大的 AI 生成能力,实现文生图、图生图、高清放大、局部重绘、外绘拓展等多种功能。 我也安装了这款插件,这个过程并不复杂,AI 出图非常稳定,软件之间的交互也非常顺畅;因为使用了 LCM lora,所以出图速度也非常快,可以做为 Ps 原生 AI 功能的平替,而且功能更多样。今天就为大家详

ComfyUI 插件教程:帮你完全掌握ComfyUI Impact 节点(一)

前言: 学习 ComfyUI 是一场持久战,而 ComfyUI Impact 是一个庞大的模块节点库,内置许多非常实用且强大的功能节点 ,例如检测器、细节强化器、预览桥、通配符、Hook、图片发送器、图片接收器等等。通过这些节点的组合运用,我们可以实现的工作有很多,例如自动人脸检测和优化修复、区域增强、局部重绘、控制人群、发型设计、更换模特服饰等。在 ComfyUI 的进阶之路上,ComfyUI Impact 是每个人不可绕过的一条大河,所以本篇文章将带领大家理解并学会使用这些节点。祝大家学习顺利,早日成为 Com

ComfyUI 进阶篇!完整梳理 ComfyUI 的核心节点(四)

前言: 学习 ComfyUI 是一场持久战。当你掌握了 ComfyUI 的安装和运行之后,会发现大量五花八门的节点。面对各种各样的工作流和复杂的节点种类,可能会让人感到不知所措。在这篇文章中,我们将用通俗易懂的语言对 ComfyUI 的核心节点进行系统梳理,并详细解释每个参数。希望大家在学习过程中培养自我思考的能力,真正掌握和理解各个节点的用法与功能。在实践中不断提升自己的技术水平。只有通过不断的探索和总结,才能在面对复杂的工作流时游刃有余。祝大家学习顺利,早日成为 ComfyUI 的高手! 往期回顾:一、Upsc