ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

ControlNet 作者新作,玩儿得人直呼过瘾,刚开源就揽星 1.2k。用于操纵图像照明效果的 IC-Light,全称 lmposing Consistent Light。玩法很简单:上传任意一张图,系统会自动分离人物等主体,选择光源位置,填上提示词,就能毫无破绽地融入新环境了!赶紧来个王家卫式的打光:不喜欢?没关系,换成窗外打进来的自然光,也就分分钟的事。目前,IC-Light 提供两类模型:文本条件重照明模型,还有背景条件模型。两种模型都需要以前景图像作为输入。鉴于之前 Controlnet 太好玩儿,这次

ControlNet 作者新作,玩儿得人直呼过瘾,刚开源就揽星 1.2k。用于操纵图像照明效果IC-Light,全称 lmposing Consistent Light。

玩法很简单:

上传任意一张图,系统会自动分离人物等主体,选择光源位置,填上提示词,就能毫无破绽地融入新环境了!

赶紧来个王家卫式的打光:

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

不喜欢?

没关系,换成窗外打进来的自然光,也就分分钟的事。

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

目前,IC-Light 提供两类模型:文本条件重照明模型,还有背景条件模型

两种模型都需要以前景图像作为输入。

鉴于之前 Controlnet 太好玩儿,这次 IC-Light 一出现就颇受关注,还有网友迅速做出了 ComfyUI 插件。

(疑惑,大家这么拼,都不睡觉的吗??)

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

不管是期待值还是用后体验,网友给得都很高:

Nice!迫不及待要上手玩了嘻嘻嘻嘻。

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

谁能帮我把这图换个背景?

从远古 MCN 到贴吧再到现在小红书,各个时代,都不乏“谁能帮我换张背景”这种求助贴。

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

但热心网友的帮助,往往是这样子的:

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

就离谱。

不过说实在话,这种需求不仅存在于你我普通人之间,电商做商品海报,也常常有类似的需求。

有了 IC-Light,好像一切都变得简单起来。

上传主体原图 + 选择光源位置 + 提示词,完事儿。

来看效果 ——

这样一张佛像原图,加上提示词“佛像、细致的脸部、科幻 RGB 发光、赛博朋克”,再选择“光从左侧打来”。

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

就能得到一张崭新的成品:

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

哪怕是日常场景也是适用的。

最后出的效果肉眼看还是比较自然:

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

根据网友分享的测评,动漫场景也适用……

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

背后技术

如前所说,IC-Light 现在提供两类模型,两种模型都需要以前景图像作为输入。

一类是文本条件重照明模型

简单来说就是用户可以通过输入提示词来搞定生成。

比如输入“左侧光线”“月光”等,模型会通过这些提示词和初始潜变量,来生成符合要求和特征的图像。

另一类是背景条件模型

这种就更简单了,不需要复杂的提示词,模型结合背景提示信息,对前景的物体进行不同风格的光照变化。

而其背后的技术原理,是通过潜在空间的一致性,确保模型输出在不同光源组合下具有一致性,从而可以稳定地合成各种光照效果

具体如下 ——

在 HDR 空间中,所有照明的光线传输都彼此独立,不同光源的外观混合效果与多光源直接作用下的外观在数学上(也就是理想状态下)是一致的。

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

以上面这张图的灯光阶段为例,来自“外观混合”和“光源混合”的两个图像是一致的,(理想情况下,在 HDR 空间中数学上等效)。

因此,在训练重新照明模型时,研究人员在潜在空间中使用多层感知机(MLP)让不同光源的组合和传输具有一致性,并用来指导生成效果。

最终产生高度一致的重新光照效果。

由于模型使用了潜在扩散技术,因此可以在潜在空间内实现学习和重光照操作,从而在各种光照条件下产生高度一致的效果。

这些结果非常一致 —— 尽管在训练时,模型没有直接使用法线图数据,但可以将不同的重新光照合并为法线贴图。

看下面这张图,从左到右依次是输入、模型输出、重新照明、分割的阴影图像和合并的法线贴图。

ControlNet 作者新作爆火:P 照片换背景不求人,AI 打光完美融入

感兴趣的小伙伴可以前往下面地址试玩儿哟~

GitHub 直通车:

https://github.com/lllyasviel/IC-Light?tab=readme-ov-file

本文来自微信公众号:量子位 (ID:QbitAI),作者:・衡宇

相关资讯

一文详解打光神器 IC-Light!可控制光照方向和色彩氛围,免费使用

大家好,这里是和你们一起探索 AI 的花生~ Controlnet、SD WebUI Forge 和 LayerDiffusion 的作者 lllyasviel 大神最近又推出了一个新的项目 IC-Light,可以实现控制一张图像的光照方向和色调氛围,今天一起我们了解一下它的特点及用法~ 相关推荐:一、IC-Light 简介 IC-Light 项目主页: IC-Light 是 "Imposing Consistent Light (营造一致的光线)" 的缩写,它是一个照明控制项目,目前支持通过文本和背景图对前景内

中国科学院团队利用AI大模型训练技术解决同步辐射海量数据处理

编辑 | XX 射线叠层相干衍射成像(X-ray ptychography)是一种理论上能够实现衍射极限分辨率的相干衍射成像技术,已广泛应用于材料、生命、半导体、能源等多种科学领域研究。新一代同步辐射光源可提供高相干度和高亮度的X射线,推动相干成像技术向高通量多维度方向发展,使得 ptychography 在大体积样本的精细结构研究和功能表征方面具有极佳的应用前景。然而,新的实验模式与应用场景带来了海量数据在线解析的技术挑战,单次实验的原始衍射图谱数据量可达 PB 量级,成为第四代同步辐射光源上科学实验的最大数据源

清华朱文武团队:开源世界首个轻量图自动机器学习库AutoGL-light

清华大学朱文武教授团队自 2020 年发布智图库(AutoGL)以来,在图自动机器学习的可解释性和可泛化能力等方面取得新进展,特别关注于图 Transformer、图分布外泛化(OOD)、图自监督学习等方面,发表图神经架构搜索评测基准,并在中国新一代开源创新服务平台 GitLink 上发布首个轻量智图库(AutoGL-light)。智图库回顾图(graph)是描述数据间关系的一般抽象,广泛存在于不同的研究领域中并有许多重要应用,例如社交网络分析、推荐系统、交通预测等互联网应用,新药物发现、新材料制备等科学应用(AI