HyperHuman

更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA

论文地址: 地址: . 研究背景与动机随着扩散模型的兴起,一些典型的模型例如 Stable Diffusion, DALL-E 2 等在文本生成图像任务上展现了令人震撼的能力。但一个明显的不足是,这些模型在文本生成人体图片的任务上表现得不尽如人意,甚至很难生成具有合理结构或自然姿态的人体(例如正确的四肢数目和符合人体物理结构的几何拓扑)。背后的主要原因在于:自然环境下的人体是铰接的,且包含刚性和非刚性的形变;生成高质量的人体图片需要文本难以描述的结构信息。为了在文生图中引入结构控制信息,近期的代表工作如 Cont
  • 1