腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频

作者：量子位

2024-12-20 09:00

提速8倍！速度更快、效果更好的混元视频模型——FastHunyuan来了！新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。

提速8倍！

速度更快、效果更好的混元视频模型——FastHunyuan来了！

新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。

和普通速度的混元对比一下，原来50步才能生成1条视频，而现在新模型在相同的时间里可以生成8条：

腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频

再来看看和Sora的画面对比，可以看到Fast-Hunyuan和Sora两者的效果都更逼真一些，衣服、水果和山峰的细节也非常清晰。

甚至在一些物理细节的理解上，Fast-Hunyuan比Sora还强，比如下面拿取柠檬的视频：

更重要的是，Fast-Hunyuan的代码也开源了，这下不用为Sora的订阅费和限额发愁了。

研究团队来自加州大学圣地亚哥分校（UCSD）的Hao AI实验室，他们主要专注机器学习算法和分布式系统的研究。

混元官方账号还特意发博感谢了他们：

有网友看完后直呼，混元才是最好的开源视频模型。

开创性的视频DiT蒸馏配方

团队是如何做到8倍提速的情况下还能提升视频清晰度呢？

下面就一起来看一下Fast-Hunyuan的技术原理——

首先，他们开发了全新的视频DiT蒸馏配方。

具体来说，他们的蒸馏配方基于阶段一致性（Phased Consistency Model, PCM）模型。

在尝试使用多阶段蒸馏后发现效果没有显著改进，最终他们选择保持单阶段设置，与原始PCM模型的配置相似。

其次，团队使用了OpenSoraPlan中的MixKit数据集进行了蒸馏。

为了避免在训练过程中运行文本编码器和VAE，团队还预处理了所有数据，用来生成文本嵌入和VAE潜在变量。

在推理阶段，用户可以通过FSDP、序列并行和选择性激活检查点进行可扩展训练，模型可以近乎线性扩展到64个GPU。测试代码在Python 3.10.0、CUDA 12.1和H100上运行。

官方推荐使用80GB内存的GPU，不同模型有相应的下载权重和推理命令。

最低硬件要求如下：

40 GB GPU 内存，每个 GPU 配备 lora
30 GB GPU 内存，每 2 个 GPU 配备 CPU 卸载和 LoRa。

在模型微调方面，Fast-Hunyuan提供了全微调（需准备符合格式的数据，提供了一些可下载的预处理数据及对应命令）和LoRA 微调（即将上线）两种方式。

此外，他们还结合了预计算潜变量和预计算文本嵌入，用户可以根据自己的硬件条件选择不同的微调方式来执行命令，也支持图像和视频的混合微调。

模型已于2024年12月17日发布了v0.1版本。

未来的开发计划还包括添加更多蒸馏方法（如分布匹配蒸馏）、支持更多模型（如CogvideoX模型）以及代码更新（如fp8支持、更快的加载和保存模型支持）等等。

One More Thing

除了加速模型，混元还预告了大家都非常期待的图像到视频生成功能。

最快1月份，也就是下个月就可以看到！期待住了。

GitHub：https://github.com/hao-ai-lab/FastVideoHuggingFace：https://huggingface.co/FastVideo/FastHunyuan

相关标签：

AI 模型数据

相关资讯

弱智吧竟成最佳中文 AI 训练数据？中科院等：8 项测试第一，远超知乎豆瓣小红书

弱智吧竟成最佳中文 AI 训练数据？中科院等：8 项测试第一，远超知乎豆瓣小红书

离大谱了，弱智吧登上正经 AI 论文，还成了最好的中文训练数据？？具体来说，使用弱智吧数据训练的大模型，跑分超过百科、知乎、豆瓣、小红书等平台，甚至是研究团队精心挑选的数据集。在问答、头脑风暴、分类、生成、总结、提取等 8 项测试中取得最高分。没错，论文中的 Ruozhiba 就是指百度贴吧弱智吧，一个充满荒谬、离奇、不合常理发言的中文社区，画风通常是这样的：最离谱的是，弱智吧 AI 代码能力也超过了使用专业技术问答社区思否数据训练的 AI，这下吧友自己都闹不明白了。其他平台围观网友也纷纷蚌埠住。这项研究来自中科院

美国酝酿 AI「登月计划」，陶哲轩领衔 62 页报告重磅发布

美国酝酿 AI「登月计划」，陶哲轩领衔 62 页报告重磅发布

【新智元导读】就在刚刚，陶哲轩领衔的一份 62 页报告出炉了，总结和预测了 AI 对半导体、超导体、宇宙基础物理学、生命科学等领域带来的巨大改变。如果这些预测在几十年后能够实现，美国酝酿的 AI「登月计划」就将成真。就在刚刚，陶哲轩领衔的一份 AI 技术对全球研究潜在影响的技术报告发布了。这份报告长达 62 页，总结了 AI 对材料、半导体设计、气候、物理、生命科学等领域已经做出的改变，以及预测它们在未来可能由 AI 产生的改变。报告地址： AI 工具已经改变的科学领域的小插曲，陶哲轩等人还发出了三个呼吁 ——1.

微软正努力治疗 AI 幻觉，以技术手段实时屏蔽和重写毫无根据的信息

微软正努力治疗 AI 幻觉，以技术手段实时屏蔽和重写毫无根据的信息

就在 GPT-4 因征服标准化测试而登上头条时，微软研究人员正在对其他 AI 模型进行一种非常另类的测试 —— 一种旨在让模型捏造信息的测试。为了治好这种被称为“AI 幻觉”的症状，他们设定了一个会让大多数人头疼的文本检索任务，然后跟踪并改进模型响应，这也是微软在测定、检测和缓解 AI 幻觉方面的一个例子。微软 AI 负责项目的首席产品官 Sarah Bird 表示，“微软希望其所有 AI 系统都是值得信赖且可以有效使用的”。我们可以向这个领域投入许多专家和资源，因此我们认为自己可以帮助阐明“应该如何负责任地使用新

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品阿里云与黑芝麻智能完成大模型车载芯片级适配突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手啥玩意值8499元？马斯克在线打call，国产AI威震天秒售罄

标签云