快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

作者：故渊

2024-10-12 09:28

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。 AI在线查询官方介绍，附上 Pyramid Flow 的核心特点如下：高效生成：Pyramid Flow 采用新技术，通过统一 AI 模型分阶段生成视频，大多数阶段为低分辨率，只有最后阶段为全分辨率。

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型，用户在输入文本之后，即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。

Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等，提供更高效、更灵活的视频生成解决方案，目前已经在 Hugging Face 平台上线，并完全开源。

AI在线查询官方介绍，附上 Pyramid Flow 的核心特点如下：

高效生成：Pyramid Flow 采用新技术，通过统一 AI 模型分阶段生成视频，大多数阶段为低分辨率，只有最后阶段为全分辨率。这种“金字塔流匹配”方法保持了视频的高视觉质量前提下，大幅降低了计算成本，tokens 数量是传统 diffusion 模型的四分之一。
快速推理：在推理过程中，该模型可以在 56 秒内生成一个 5 秒、384p 的视频，速度媲美许多全序列 diffusion 模型，甚至更快。
开源和商业使用：Pyramid-Flow 在 MIT 许可证下发布，允许广泛的使用，包括商业应用、修改和再分发，吸引了希望将模型集成到专有系统中的开发者和公司。

AI在线附上参考地址

Pyramidal Flow Matching for Efficient Video Generative Modeling
New high quality AI video generator Pyramid Flow launches — and it’s fully open source!
Hugging Face
Github
Pyramidal Flow Matching for Efficient Video Generative Modeling

快手联合推出 Pyramid Flow 开源文生视频 AI 模型：最高 10 秒 768P@24fps，创新金字塔流匹配让推理 tokens 降至 1/4

相关资讯

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

字节跳动提速 AI：Flow 部门下设四大业务线，挖角大批百度阿里员工

扩散模型、最优传输存在什么关系？法国数学家4页论文引网友围观