AI在线 AI在线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

作者:新智元
2025-04-10 09:54
还记得前段时间字节跳动备受关注的数字人技术Omnihuman-1吗? 最近,这支团队一项基于DiT架构的可控人像视频生成技术DreamActor-M1,一经发布,又在推特上引起了超百万量级的关注——仅需一张静态照片和一段驱动视频,便可生成高质量、达到电影级别的视频,将人像视频生成的表现力提升至全新水平! 左右滑动查看项目网页::,还能精准捕捉并迁移驱动视频中的动作和表情,呈现出高度逼真的效果,极大地简化了现有的动作捕捉、角色动画以及内容创作流程。

还记得前段时间字节跳动备受关注的数字人技术Omnihuman-1吗?

最近,这支团队一项基于DiT架构的可控人像视频生成技术DreamActor-M1,一经发布,又在推特上引起了超百万量级的关注——

仅需一张静态照片和一段驱动视频,便可生成高质量、达到电影级别的视频,将人像视频生成的表现力提升至全新水平!

图片

图片

图片

左右滑动查看

项目网页:

https://grisoon.github.io/DreamActor-M1/

论文地址:

https://arxiv.org/pdf/2504.01724

DreamActor-M1不仅能够保留原图中的身份特征,还能精准捕捉并迁移驱动视频中的动作和表情,呈现出高度逼真的效果,极大地简化了现有的动作捕捉、角色动画以及内容创作流程。

据悉,Omnihuman-1技术已经应用于即梦数字人玩法的「大师模式」而DreamActor-M1模型也将于近期上线即梦AI,用户将可以在「数字人」-「动作模仿」功能下体验新模型。相比已有的动作模仿效果,在生成内容逼真度、画风支持、画面比例支持等多个方面将大幅优化。

图片

方案介绍

先一起来看看DreamActor-M1的效果:

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

玛丽莲梦露不仅能够精准复刻参考视频的动作,保持语音和口型一致,手臂大幅度摆动也不会出现严重的变形或虚影

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

在日光下,男子随着参考视频动作的同时,能看到光影相应的变化

与以往方法不同,DreamActor-M1采用多控制信号混合驱动架构,能够精准还原从眼神等细腻表情到肢体动作的各类表现,可驱动从真人到卡通的不同形象,支持从肖像画幅到全身画幅的多种画幅,显著增强了单图视频驱动能力的表现力与易用性。

  • 在表情迁移方面,该系统运用隐式Face Motion Tokenizer,通过对大量人像视频进行自监督训练,实现对表情细节的精准建模。
  • 在动作迁移方面,采用3D头部球体和3D身体骨架,能够支持各种风格角色的肢体动作精准迁移。
  • 在画幅支持方面,DreamActor-M1基于DiT架构,并通过大量数据进行多阶段训练,可精准复刻各种画幅镜头,为用户提供了更广阔的创作空间。

各种画幅高表现还原

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

各种风格角色都支持

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

图片

图片

图片

图片

图片

图片

图片

技术对比

相较于其他SOTA动作迁移和表情迁移工作,DreamActor-M1在人物ID保持、动作表情还原、视频生成质量方面都有着更好表现,为高效完成高质量内容创作创造了新的可能性。

  • 与动作迁移工作的对比

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

  • 与表情迁移工作的对比

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1,推特关注超百万!即梦AI即将上线

安全说明

模型上线即梦AI后,平台将对视频内容进行严格的安全审核,并对输出视频添加「AI生成」水印,即梦AI现有的「动作模仿」功能也要求用户上传视频素材需确保拥有合法授权。

团队介绍

字节跳动智能创作团队是字节跳动AI&多媒体技术中台,通过建设领先的计算机视觉、音视频编辑、特效处理等技术,支持抖音、剪映、头条等公司内众多产品线;同时为外部ToB合作伙伴提供业界最前沿的智能创作能力与行业解决方案。

其中数字人团队专注于建设行业领先的数字人生成和驱动技术,丰富智能创作内容生态。该团队的OmniHuman-1 、PersonaTalk、Loopy、CyberHost等前沿创新的数字人成果均已在即梦AI快速应用,未来还将持续通过即梦AI为用户带来新奇和惊喜的体验。

相关标签:

相关资讯

多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳

本文一作 Maham Tanveer 是 Simon Fraser University 的在读博士生,主要研究方向为艺术视觉生成和创作,此前在 ICCV 发表过艺术字体的生成工作。 师从 Hao (Richard) Zhang, IEEE Fellow, Distinguished Professor, 并担任 SIGGRAPH 2025 Paper Chair. 本文尾作 Nanxuan (Cherry)  Zhao 在 Adobe Research 担任 Research Scientist, 研究方向为多模态可控生成和编辑,有丰富的交叉方向研究经历(图形学 图像 人机交互),致力于开发可以让用户更高效进行设计创作的算法和工具。
2/3/2025 12:16:01 PM
机器之心

Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

针对视频生成中的运动一致性难题,Meta GenAI团队提出了一个全新框架VideoJAM。 VideoJAM基于主流的DiT路线,但和Sora等纯DiT模型相比,动态效果直接拉满:哪怕变化又大又迅速、动作又复杂的舞蹈,也看起来像真的一样,而且还是两个人同步:像倒立这样的操作,同样可以轻松驾驭:而且不需要额外数据或缩放,就能无缝集成到不同规模的DiT模型当中,带来运动效果的提升。 有网友表示,第一眼看上去就和真的一样,也许到今年年底,我们看不到区别了。
2/10/2025 1:15:00 PM
量子位

开源AI短剧神器来了,单卡即可部署!好莱坞效果人人可享,昆仑万维出品

开源AI短剧神器来了! 来自昆仑万维,一次性开源两大视频模型——国内首个面向AI短剧创作的视频生成模型SkyReels-V1;国内首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。 当前全球AI视频生成模型和产品面临着不开源、用不到、费用高、不好用等痛点。
2/18/2025 11:09:27 AM
量子位