阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行

2025-02-27 10:08

近日，阿里巴巴在深夜推出了全新的开源视频生成模型 Wan2.1，该模型凭借14B 的参数量迅速占据了 VBench 榜单的顶端，成为目前视频生成领域的佼佼者。与此之前发布的 QwQ-Max 不同，Wan2.1在复杂运动的细节处理上表现出色，能够流畅地实现多个人物的同步舞蹈，令人惊叹不已。官方演示中，Wan2.1不仅成功克服了静态图像生成中的难题，如文字的处理更是达到了新的高度。

近日，阿里巴巴在深夜推出了全新的开源视频生成模型 Wan2.1，该模型凭借14B 的参数量迅速占据了 VBench 榜单的顶端，成为目前视频生成领域的佼佼者。与此之前发布的 QwQ-Max 不同，Wan2.1在复杂运动的细节处理上表现出色，能够流畅地实现多个人物的同步舞蹈，令人惊叹不已。

官方演示中，Wan2.1不仅成功克服了静态图像生成中的难题，如文字的处理更是达到了新的高度。对于普通用户来说，虽然14B 的参数在个人消费级显卡上部署较为困难，但阿里还特别推出了一个1.3B 的小版本，支持480P 分辨率，使用12GB 显存的4070显卡即可流畅运行。

大脑大模型

图源备注：图片由AI生成，图片授权服务商Midjourney

除了14B 和1.3B 版本，阿里还发布了两个额外的视频生成模型，均采用 Apache2.0协议，意味着用户可以免费商用。在实际操作中，用户可以通过阿里提供的平台访问这款模型，快速生成视频，但由于用户量激增，有时可能会出现等待时间过长的情况。对于有一定技术基础的用户，还可以通过 HuggingFace 和魔搭社区等多种途径自行安装和调试。

Wan2.1最大的亮点在于其技术创新。该模型采用了 Diffusion Transformer 架构，并使用3D 变分自动编码器，专门为视频生成设计。通过引入多种压缩和并行策略，该模型在保证质量的同时，大幅度提高了生成效率。研究表明，Wan 的重建速度是当前同类技术的2.5倍，大大节省了计算资源。

在用户体验方面，Wan2.1也获得了众多好评。无论是生成动态场景中的细节，还是自然的物理效果，模型的表现都让人眼前一亮。用户们通过该模型不仅能够制作出高质量的视频作品，还能轻松实现文字的动态呈现，为创作带来了更多可能。

阿里巴巴的 Wan2.1模型不仅技术先进，而且为广大创作者提供了更多的创作自由度，标志着视频生成技术的又一突破。

超强视频生成模型 Wan2.1 GP：低配GPU也能搞定大片！

近日，DeepBeepMeep 团队在 GitHub 上发布了 Wan2.1GP，一个针对低端 GPU 用户优化的视频生成模型。该模型基于阿里巴巴的 Wan2.1，旨在为缺乏高性能 GPU 资源的用户提供强大的视频生成能力。 Wan2.1GP 的推出标志着视频生成技术的一个重要进步，尤其是在开放源代码领域。

3/4/2025 11:50:00 AM

AI在线

通义万相开源视频生成模型Wan2.1：8.2G显存即可生成480P视频

近日，通义宣布开源其最新的通义万相大模型 Wan2.1。 Wan2.1是一款专注于高质量视频生成的 AI 模型，凭借其在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面的卓越表现，成为了创作者、开发者和企业用户拥抱 AI 时代的首选工具。在权威评测集 Vbench 中，通义万相 Wan2.1以总分86.22% 的成绩登顶榜首，大幅领先国内外其他知名视频生成模型，如 Sora、Minimax、Luma、Gen3和 Pika 等。

2/26/2025 7:58:00 AM

AI在线

360智脑团队成功复现Deepseek强化学习效果，发布开源模型Light-R1-14B-DS

近日，360智脑团队宣布成功复现Deepseek的强化学习效果，并正式发布开源推理模型 Light-R1-14B-DS。该模型性能表现超越 DeepSeek-R1-Distill-Llama-70B和 DeepSeek-R1-Distill-Qwen-32B，成为业界首款在14B参数规模上实现强化学习效果的模型，显著提升了数学推理能力，成绩超过大多数32B级别模型。与 DeepSeek-R1-14B 相比，Light-R1-14B-DS*在数学竞赛任务中表现突出:在 AIME24测试中提升4.3分，在 AIME25中更是提高10分。

3/14/2025 10:07:00 AM

AI在线

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发本地部署DeepSeek+DiFy平台构建智能体应用击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行

相关资讯

超强视频生成模型 Wan2.1 GP：低配GPU也能搞定大片！

通义万相开源视频生成模型Wan2.1：8.2G显存即可生成480P视频

360智脑团队成功复现Deepseek强化学习效果，发布开源模型Light-R1-14B-DS