昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1

昆仑万维官方介绍称,SkyReels-V1 针对表演细节做了打标,还对情绪、场景、表演诉求等进行处理,利用“千万级别、高质量”的好莱坞级别数据进行训练微调。

昆仑万维今日宣布开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1、国内首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1

图片

昆仑万维官方介绍称,SkyReels-V1 针对表演细节做了打标,还对情绪、场景、表演诉求等进行处理,利用“千万级别、高质量”的好莱坞级别数据进行训练微调

昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1

此外,SkyReels-V1 可实现“影视级人物微表情表演生成”,支持 33 种人物表情与 400 + 种自然动作组合,还原真人情感表达,支持生成大笑、怒吼、惊讶、哭泣等微表情。

基于好莱坞级的影视数据训练,当前 SkyReels 生成的每一帧画面,在构图、演员站位、相机角度等号称都具备“电影级的质感”。

昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1

SkyReels-V1 不仅支持文生视频,还支持图生视频,号称是“开源视频生成模型中参数最大的支持图生视频的模型”,在同等分辨率下各项指标实现开源 SOTA。

图片

总结来看,SkyReels-V1 可以实现:

  • 影视化表情识别体系:11 种针对影视戏剧中的人物表情理解,如不屑、不耐烦、无助、厌恶等表情的理解;

  • 人物空间位置感知:基于人体三维重建技术,实现对视频中多人的空间相对关系理解,助力模型生成影视级人物站位;

  • 行为意图理解:构建超过 400 种行为语义单元,实现对人物行为的精准理解;

  • 表演场景理解:实现人物-服装-场景-剧情的关联分析。

性能方面,在自研推理优化框架「SkyReels-Infer」的加持下,该模型可实现 544p 分辨率,推理基于单台 4090 用时 80s,还支持分布式多卡并行,支持 Context Parallel,CFG Parallel,和 VAE Parallel。

此外,模型采取 fp8 quantization 以及 parameter-level offload,满足低显存用户级显卡运行需求;支持 flash attention、SageAttention,模型编译优化等,进一步优化延迟;基于开源 diffuser 库,提升易用性。

为了实现更加精准可控的人物视频生成,昆仑万维还开源了 SOTA 级别的基于视频基座模型的表情动作可控算法 SkyReels-A1,对标 Runway 的 Act-One,SkyReels-A1 支持视频驱动的电影级表情捕捉。

SkyReels-A1 能够基于任意人体比例(包括肖像、半身及全身构图)生成人物动态视频

如下图所示,将参考人物图片(上图)和驱动视频(左下)同时作为输入,在 SkyReels-A1 的能力加持下,生成了新的视频 —— 将驱动视频中的面部表情和表演细节“移植”到给定参考图片的人物身上。

昆仑万维开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1

AI在线附开源地址如下:

    • SkyReels-V1:https://github.com/SkyworkAI/SkyReels-V1

    • SkyReels-A1:https://github.com/SkyworkAI/SkyReels-A1

技术报告:

  • https://skyworkai.github.io/skyreels-a1.github.io/report.pdf

相关资讯

一个人就能拍短剧!国产AI视频神器SkyReels太强了(附教程)

2 月 18 号,昆仑万维开源了面向 AI 短剧创作的大模型 SkyReels-V1、中国首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1,出于好奇,我们对这个模型目前的使用情况进行了搜索,从而发现了在海外的视频生成平台 SkyReels,在进行体验之后,我们惊讶于这个平台在 AI 生视频垂直领域的技术能力。 它以一种更加落地和成熟的姿态出现在我们面前。 随着短剧潮的到来,使得短剧拍摄成本越来越高。

国内首个短剧创作大模型开源了,一个人就能拍短剧,单卡80秒出大片

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

昆仑万维推出全球首款 AI 短剧平台 SkyReels,「一人一剧」时代来临

8月19日,昆仑万维发布全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。SkyReels平台集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,让创作者一键成剧,轻松制作高质量AI视频。这是一个2分半时长的短剧作品。「 我们应该放下固化和抵抗的思维,拥抱这个碎片化信息时代。」 2023 年 12 月初,导演黄建新在北京电影学院北影大讲堂上感慨,比起电影,竖屏短剧兴起才真正形成了全球输出。 几分钟到十几分钟的单集时长、强烈的娱乐性和快节奏剧情,频繁踩中用户「爽点」,短短三年(到 2023