感谢商汤科技在世界人工智能大会(WAIC)上发布了首个“可控”人物视频生成大模型 Vimi,通过一张任意气概的照片就能生成和目标举动一致的人物类视频,并支持多种启动方式,可通过已有人物视频、动画、声音、文字等多种元素进行启动。与图片脸色负责类技术只能负责头部脸色举动分别,商汤称 Vimi 不但可以实行精确的人物脸色负责,还可实行在半身区域内负责照片中人物的自然肢体变革,并主动生成与人物相符的头发、服饰及背景变革。同时 Vimi 可波动生成 1 分钟的单镜头人物类视频,画面效果不会随着时间的变革而劣化或失真,满足娱乐
感谢商汤科技在世界人工智能大会(WAIC)上发布了首个“可控”人物视频生成大模型 Vimi,通过一张任意气概的照片就能生成和目标举动一致的人物类视频,并支持多种启动方式,可通过已有人物视频、动画、声音、文字等多种元素进行启动。
与图片脸色负责类技术只能负责头部脸色举动分别,商汤称 Vimi 不但可以实行精确的人物脸色负责,还可实行在半身区域内负责照片中人物的自然肢体变革,并主动生成与人物相符的头发、服饰及背景变革。
同时 Vimi 可波动生成 1 分钟的单镜头人物类视频,画面效果不会随着时间的变革而劣化或失真,满足娱乐互动等需要长时间波动视频生成需求。
Vimi 将完全面向 C 端用户开放使用,用户只需上传分别角度的高清人物图片,即可主动生成数字两全和分别气概的写真视频。
由 Vimi 生成的视频人物不再只是古板的五官运动,而是搭配手势、肢体、头发等,形成更完整、统一的人物举动,让创作者可基于生成的视频素材进行剪辑和再创作。
商汤表示将在明日公布 Vimi 的更多细节,IT之家也会持续关注并带来跟进报道。