春节档上映的《你好,李焕英》让不少人在影院哭得稀里哗啦,它戳中了每个人心里最柔软的部分。有人看完电影之后会给妈妈打个电话,有人会拿出妈妈年轻时的照片,感叹一下爸爸的基因为什么要那么强大。
B 站知名 up 主大谷也是《你好,李焕英》的影迷之一,不过他做了一点不一样的事情:尝试用一系列 AI 技术建设了李焕英年轻时的黑白照片,不仅给照片上了色、提高了分辨率,还让照片中的人物动了起来。
原始黑白照片。
建设后的动态彩色照片。
整个建设的流程并不复杂,涉及 AI 色彩复原、AI 清晰度增强、脸部精修、手绘微调等过程:
最终的建设效果如下:
大谷表示,他是偶然间看到了这张老照片,很有感触,于是试着用 AI 脑补复原了一下拍摄前的动态影像。不过,由于复原场景动态与上色是基于 AI 技术生成,具有一定的想象元素,因此不等于准确复原。
为了帮助大家掌握这项技能,大谷还公布了他用到的两个开源项目:飞桨 PaddleGAN 和 DFDNet。
飞桨 PaddleGAN
GAN 的全称是生成抗衡收集,被「卷积收集之父」Yann LeCun(杨立昆)誉为「过去十年计算机科学领域最有趣的想法之一」,是近年来火遍全网、AI 研究者最为关注的深度学习算法方向之一。
GAN 在诸多领域都有着成功的应用,如图象生成 / 建设、超分辨率、图象噪声消除、换装 / 妆、图象风格迁徙、文字 / 声音生成等,覆盖互联网、娱乐、游戏等各个行业。
为了给开发者提供经典及前沿的生成抗衡收集高性能实行,并支撑开发者快速构建、训练及部署生成抗衡收集,百度飞桨打造了一个图象生成模型库——PaddleGAN,覆盖 Pixel2Pixel、CycleGAN、StyleGAN2、PSGAN 等经典 GAN 模型,支持视频插帧、超分辨率、老照片 / 视频上色、视频作为生成等应用。
除了上面展示的视频建设,PaddleGAN 还能提供各类不同的图形影像生成、处理能力。人脸属性编辑能力能够在人脸识别和人脸生成基础上,操纵面部图象的单个或多个属性,实行换妆、变老、变年轻、变换性别、发色等,使得一键换脸成为可能 *;* 作为迁徙能够实行肢体作为变换、人脸表情作为迁徙等。
比如这样:
让苏大强表达心中之痛,唱起 unravel(视频链接:https://www.bilibili.com/video/BV1Yy4y1r7DC)。
这样:
还有这样:
PaddleGAN 项目链接:https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md
DFDNet
近年来,基于参照的人脸建设法子已经受到了很多关注,但这些法子大多需要来自相同身份的高质量的参照图象,因此只适用于有限的场景。为了解决这一问题,来自哈尔滨工业大学、香港大学等机构的研究者在《Blind Face Restoration via Deep Multi-scale Component Dictionaries》一文中提出了一种名为深度人脸字典收集(deep face dictionary network,DFDNet)的法子来指导进化观测(dgraded observation 的建设过程。
首先,作者使用 K-means,利用高质量图象为感知显著的人脸部位(如左 / 右眼、鼻子和嘴)生成深度字典。接下来,利用进化输入(degraded input),研究者从相应的字典中匹配和选择最相似的部位特征,并通过提出的字典特征迁徙块(DFT)将高质量的细节迁徙到输入上。最后,利用多标准字典逐步实行从粗粒度到细粒度的建设。
实验结果表明,作者提出的法子在定性和定量评估中都能实行合理的性能。更加重要的是,该法子可以在不需要 identity-belonging 参照的情况下,利用真实的进化图象(degraded image)生成逼真、有前景的结果。以下是一些人脸建设效果展示:
该收集的基本结构如下:
收集主要包含两个部分:a. 从大量包含各种姿态和表情的高质量图象中离线生成多标准组件字典。这部分使用 K-means 算法为每个部位(即左 / 右眼、鼻子和嘴)在不同标准上生成 K 个簇;b. 建设过程和字典特征迁徙(DFT)块,用于以渐进的方式提供参照细节。
论文链接:https://arxiv.org/pdf/2008.00418.pdf
项目链接:https://github.com/csxmli2016/DFDNet
参照链接:
https://mp.weixin.qq.com/s/xSic1Tk93dk_N1qMylymtg
https://www.bilibili.com/video/BV1wh411k7YN?p=1&share_medium=iphone&share_plat=ios&share_source=WEIXIN_MONMENT&share_tag=s_i×tamp=1613972331&unique_k=KQGwoS