首次实现中文文字生成，消息称阿里通义万相 2.1 视频生成模型今晚开源

据新浪科技援引知情人士消息称，阿里巴巴将于今晚全面开源旗下视频生成模型万相2.1模型。

据新浪科技援引知情人士消息称，阿里巴巴将于今晚全面开源旗下视频生成模型万相 2.1 模型。

今年 1 月，阿里通义万相推出了 2.1 版本模型升级，其在视频生成、图像生成两大能力均有显著提升。

在视频生成方面，通义万相 2.1 通过自研的高效 VAE 和 DiT 架构增强了时空上下文建模能力，支持无限长 1080P 视频的高效编解码，首次实现了中文文字视频生成功能，登上 VBench 榜单第一。

据介绍，通义万相 2.1 支持中英文视频，都可以一键生成艺术字，还提供多种视频特效选项，以增强视觉表现力，例如过渡、粒子效果、模拟等等。其还支持复杂运镜，可还原碰撞、反弹、切割、挤压等真实世界的物理规律，例如雨滴落在伞上会溅起水花。

官方曾表示，通义万相 2.1 支持中英文一键生成艺术字，还提供了多种视频特效选项，如过渡、粒子效果、模拟等等。

首次实现中文文字生成，消息称阿里通义万相 2.1 视频生成模型今晚开源

据AI在线此前报道，通义万相去年 9 月宣布支持文生视频、图生视频等，还有插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。

业界首个，阿里通义万相“首尾帧生视频模型”开源

它可根据用户指定的开始和结束图片，生成一段能衔接首尾画面的 720p 高清视频，此次升级将能满足用户更可控、更定制化的视频生成需求。

4/17/2025 10:55:39 PM

汪淼

通义万相 2.1 还支持复杂运镜，可还原碰撞、反弹、切割、挤压等真实世界的物理规律，例如雨滴落在伞上会溅起水花。

1/10/2025 11:03:37 AM

问舟

通义千问本次发布了两个新的开源模型，分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M，这是通义千问首次将开源的 Qwen 模型的上下文扩展到 1M 长度。

1/27/2025 7:14:12 AM

浩渺

资讯热榜

标签云

顶部