快手可灵上线图生视频与最长 3 分钟的视频续写性能

感谢快手可灵新性能“图生视频”和“视频续写”今日上线。图生视频性能,支援将动态图象转化为 5 秒钟视频,用户可通过提示词文本控制图象中物体的静止;视频续写性能,支援对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。 IT之家附快手可灵官方网站:,能够生成大幅度的合理静止,模拟物理世界特性。可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步收缩,

感谢快手可灵新性能“图生视频”和“视频续写”今日上线。

图生视频性能,支援将动态图象转化为 5 秒钟视频,用户可通过提示词文本控制图象中物体的静止;视频续写性能,支援对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频;此外文生视频新增 9:16 和 1:1 视频尺寸选择。

IT之家附快手可灵官方网站:https://kling.kuaishou.com/

快手可灵上线图生视频与最长 3 分钟的视频续写性能

可灵是由快手自研打造的视频生成大模型,能够生成大幅度的合理静止,模拟物理世界特性。

快手可灵上线图生视频与最长 3 分钟的视频续写性能

可灵使用了 DiT 架构,快手对模型中的隐空间编 / 解码、时序建模等模块进行了升维处理。

在隐空间编 / 解码上,快手自研了 3D VAE 网络,实现时空同步收缩,获得了较高的重建质量,在训练性能和效果之间取得了平衡。在时序信息建模上,快手设计了一款全注意力机制作为时空建模模块。

给TA打赏
共{{data.count}}人
人已打赏
AI

阿里云推出首个 AI 程序员,具备架构师、开发 / 尝试工程师等岗位技能

2024-6-21 13:39:41

AI

乐聚夸父人形机器人亮相 HDC 2024,搭载华为云盘古具身智能大模型

2024-6-21 17:51:02

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索