随着 Stable Diffusion 的不断进化,越来越多的开发者加入到插件开发的行列中。大家都知道网上虽然教程多,但非常碎片,一个个学习和查阅真的非常耗时,感觉每天都在烧脑。如果你是 SD 小白或者是小懒猫,又想快速上手应用 Stable Diffusion 插件,那么这篇文章就非常适合你了!因为这是以设计师日常应用的角度出发,从推举指数、易上手水准、应用频次三个维度来测评。
希望这篇文章能够帮助大家更好地了解 Stable Diffusion 插件。
更多SD插件:
一、前方高能
1. prompt-all-in-one 提醒词翻译补全(主动翻译)
推举指数:☆☆☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆☆☆☆
能做什么:prompt-all-in-one 提醒词翻译补全可以帮助英文不好的用户,快速弥补英文短板。其中包含,中文输入主动转英文、主动保存应用描述词、描述词历史记录、快速修改权重、收藏常用描述词、翻译接口可以多种选择、一键粘贴删除描述词等。
扩张地点: https://github.com/Physton/sd-webui-prompt-all-in-one
2. SixGod 提醒词插件
推举指数:☆☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆☆☆
能做什么:SixGod 提醒词插件可以帮助用户快速生成逼真、有创意的图象。其中包含,清空正向提醒词”和“清空负向提醒词、提醒词起手式包含人物、服饰、人物发型等各个维度的提醒词、一键清除正面提醒词与负面提醒词、随机灵感关键词、提醒词分类组合随机、动态随机语法等。
扩张地点: https://github.com/thisjam/sd-webui-oldsix-prompt
3. After Detailer 人脸及手部建设插件
推举指数:☆☆☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆☆☆
能做什么:After Detailer 是一款富强的图象编辑对象,可用于建设和编辑图象。主动建设图象中的瑕疵 ,无论是 2D 还是真实的人脸及手部都可以通过辨认面部/人物/手部并主动对其进行 mask 和重绘的对象,可以通过调整参数去改变辨认的对象和辨认区域的大小及位置等。
扩张地点: https://github.com/Bing-su/adetailer
4. Tagger 提醒词反推
推举指数:☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆
能做什么:Tagger 提醒词反推可以从任意图片中提取。帮助理解图象的内容、创建创意图象、分析图象数据。
扩张地点: https://github.com/pythongosssComfyUI-WD14-Tagger?tab=readme-ov-file
5. Inpaint Anything 蒙版换装换脸
推举指数:☆☆☆☆
易上手水准:☆☆☆
应用频次:☆☆
能做什么:Inpaint Anything 是一款富强的图象编辑对象,可用于删除和替换图象中的任何内容。它应用人工智能来主动辨认和建设图象中的缺陷,无需应用遮罩。删除图象中的不需要的对象或瑕疵、建设图象中的损坏、替换图象中的对象或背景、创建创意图象效果。
扩张地点: https://github.com/Uminosachi/sd-webui-inpaint-anything
6. Segment Anything 辨认支解图片中的物体
推举指数:☆☆☆
易上手水准:☆☆
应用频次:☆
能做什么:Segment Anything 是一款富强的图象支解对象,可用于主动辨认和支解图象中的不同对象。类似于 controlnet 中的 SEG 语义支解,但 Segment Anything 是功能更富强、准确性更高、易用性也更高的图象支解对象, 但学习成本更高。
扩张地点: https://github.com/facebookresearch/segment-anything.git
7. ultimate SD upscale 图片放大
推举指数:☆☆☆☆
易上手水准:☆☆☆☆
应用频次:☆☆☆☆
能做什么:Ultimate SD Upscale 是一款富强的图象超分辨率对象,可用于将低分辨率图象提升到高分辨率、减少噪声和模糊。Ultimate SD Upscale 应用的超分辨率模型是基于深度学习的,因此具有较高的准确性。
扩张地点: https://github.com/Coyote-A/ultimate-upscale-for-automatic1111.git
8. Tiled Diffusion
推举指数:☆☆☆
易上手水准:☆☆
应用频次:☆☆☆
能做什么:Tiled Diffusion 同样是图象超分辨率、建设图象瑕疵的对象。Tiled Diffusion 适合小显存,速度更快,细节添加更可控,也不容易崩坏。
扩张地点: https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111
本人用 Ultimate SD Upscale 最多,因为它相对更有发挥空间。而 Tiled Diffusion 是可以让图片看起来更逼真。、
10. Additional Networks
推举指数:☆☆
易上手水准:☆
应用频次:☆
能做什么:Additional Networks 是一个由 Google AI 开发的插件,可用于模型中添加额外的 LoRA,也可帮我们控制多个 LoRA 模型生成混合风格的图象,从而提升图片的独创性。
扩张地点: https://github.com/kohya-ss/sd-webui-additional-networks.git
11. Image-recognition 图片信息辨认
推举指数:☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆☆☆
能做什么:sd-webui-图片信息辨认是一个由 Google AI 开发的开源插件,可基于图片辨认模型、图片中的物体、场景、人物等信息,并将其输出为文本。
扩张地点: https://github.com/google/sd-webui-image-recognition
12. Openpose Editor 姿势编辑
推举指数:☆☆☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆☆☆☆
能做什么:辨认图片中的人物姿势,可以根据需求随意调整人物的姿势,例如武术、手托腮、人物复杂姿势。
13. DWpose 手部建设
推举指数:☆☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆☆☆
能做什么:普通 OpenPose 模型的强化版,对手部动态辨认有更好的理解能力,对复杂的穿插关系的姿势辨认表现出众。
扩张地点: https://github.com/IDEA-Research/DWPose
14. IP-Adaper
推举指数:☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆☆
能做什么:IP-Adapter 是腾讯的另一个实验室 Tencent AI Lab 研发的控图模型。名称中的 IP 指的是 Image Prompt 图象提醒,它和 T2I-Adapter 一样是一款小型模型,用于风格迁移、可理解为垫图。
扩张地点: https://github.com/tencent-ailab/IP-Adapter ;https://ip-adapter.github.io/
15. Recolor 重新上色
推举指数:☆☆☆☆
易上手水准:☆☆☆☆☆
应用频次:☆
能做什么:Recolor 是给图片填充颜色,非常适合建设一些黑白老旧照片和去过色的图片。
16. T2I-Adapter 文生图适配器
推举指数:☆☆☆☆
易上手水准:☆
应用频次:☆☆
能做什么:T2I-Adapter 由腾讯 ARC 实验室和北大视觉信息智能学习实验室联合研发的一款小型模型,它的作用是为各类文生图模型提供额外的控制引导,同时又不会影响原有模型的拓展和生成能力。T2I-Adapter 的特点是体积小,参数级只有 77M,但对图象的控制效果不错。
扩张地点: https://huggingface.co/TencentARC/T2I-Adapter/tree/main/models
总体而言,Stable Diffusion 功能非常富强、也逐渐变得易于应用了。如果你还没有尝试过 SD,我强烈建议你试试看。它一定会给你带来惊喜!