阿里通义万相宣布即将开源视频生成模型WanX 2.1

作者：AI在线

2025-02-21 09:39

近日，阿里巴巴宣布视频生成模型WanX2.1将全面开源，同时公布了最新视频效果。 2025年1月，阿里巴巴旗下通义万相团队推出Wanx2.1多模态大模型，凭借其在视频生成领域的突破性进展，荣登VBench评测榜单首位，重新定义了AI驱动的视觉创作标准。 WanX 团队[昨晚宣布即将开源其最新的 WANX2.1视频生成模型。

近日，阿里巴巴宣布视频生成模型WanX2.1将全面开源，同时公布了最新视频效果。

2025年1月，阿里巴巴旗下通义万相团队推出Wanx2.1多模态大模型，凭借其在视频生成领域的突破性进展，荣登VBench评测榜单首位，重新定义了AI驱动的视觉创作标准。WanX 团队[昨晚宣布即将开源其最新的 WANX2.1视频生成模型。

据悉，Wanx2.1首次攻克了AI视频模型中长期存在的文字生成难题，成为全球首个支持中英文文字特效的模型。用户仅需输入文本指令即可生成动态视频，并搭配多样化的过渡、粒子等特效。此外，通过自研的高效VAE与DiT架构，模型实现了无限长1080P视频的高效编解码，显著提升了时空上下文建模能力。

在物理规律模拟方面，Wanx2.1能够精准还原碰撞、反弹、切割等复杂场景。例如，生成“雨滴落在伞面溅起水花”或“花样滑冰运动员旋转”的视频时，肢体协调性和运动轨迹均符合真实物理规律，有效解决了传统模型肢体扭曲、动作僵硬的问题。

阿里通义万相宣布即将开源视频生成模型WanX 2.1

相关资讯

低质多模态数据融合，多家机构联合出了篇综述论文

ECCV 2024 oral | 首次基于深度聚类的多模态融合，上交、伯克利提出双向结构对齐的融合网络新SOTA！

微软开源视频Tokenizer新SOTA！显著优于Cosmos Tokenizer和Open-Sora

评论

阿里通义万相宣布即将开源视频生成模型WanX 2.1

相关资讯

低质多模态数据融合，多家机构联合出了篇综述论文

ECCV 2024 oral | 首次基于深度聚类的多模态融合，上交、伯克利提出双向结构对齐的融合网络新SOTA！

微软开源视频Tokenizer新SOTA！显著优于Cosmos Tokenizer和Open-Sora

评论

分享