阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

最近的 AI 新闻有点太密集了,肝快废了。 25号凌晨 2 点半,Claude 发 3.7 Sonnet,凌晨 5 点半,阿里发了推理模型 QwQ-Max 的预览版,早上 10 点 DeepSeek 开源了一个 DeepEP 代码库,然后晚上 10 点 20,阿里的视频模型万相 2.1,也来了。 Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了AI 这个行业真的卷生卷死,凌晨 2 点半,刚想早睡一点点,9 点起来蹲 DeepSeek 的开源。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

最近的 AI 新闻有点太密集了,肝快废了。

25号凌晨 2 点半,Claude 发 3.7 Sonnet,凌晨 5 点半,阿里发了推理模型 QwQ-Max 的预览版,早上 10 点 DeepSeek 开源了一个 DeepEP 代码库,然后晚上 10 点 20,阿里的视频模型万相 2.1,也来了。

Claude 3.7 Sonnet深夜上线,AI编程的天又被捅破了

AI 这个行业真的卷生卷死,凌晨 2 点半,刚想早睡一点点,9 点起来蹲 DeepSeek 的开源。

阅读文章 >

而且,正式开源。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

2 月 25 号是什么黄道吉日吗。。。

万相 2.1 开源链接在此:

  1. Huggingface 的: https://huggingface.co/Wan-AI
  2. GitHub 的: https://github.com/Wan-Video/Wan2.1

阿里,真的也是“源神”。

这次上线的有四个模型,文生和图生各俩。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

文生视频模型有 1.3B 和 14B 两个规格。图生视频模型都是 14B,分辨率一个 480P 一个 720P。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

这回比较让人惊喜的是,低配置的模型真的小,1.3B 的模型,只需要 8 个 G 的显存就能跑了,也就是说,本地的 4060 都能跑得动了。

如果你有 4090,跑一条 5 秒钟的 480P 视频的时间大概只要 4 分钟。

说实话,在年前的时候,万相 2.1 就已经上线通义万相了。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

只不过叫 2.1 专业和 2.1 极速版。

这块在我测试下来,专业版和极速版其实都是 14B 的,只不过专业版感觉是原生 720P,极速版是直出的 480P 然后超分到 720P 的。

而 1.3B 是这次为了本地部署特意出的,所以线上目前还没有体验渠道,想用的话,只能自己部署。

我也第一时间跑了一些 case,14B 因为太大了,我直接用线上的通义万相来跑的。1.3B 我是直接在魔搭上部署了跑的,还是比较简单的。

网址:https://www.modelscope.cn/models/Wan-AI/Wan2.1-T2V-1.3B

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

整体效果上,语义理解、物理真实性、复杂运动的表现,万相 2.1 14B 在开源视频模型里绝对是第一梯队,而 1.3B 别看小,但是使用门槛也低啊,在实力上也真的完全不含糊。

直接先上一点我们跑的 case。

首先是长文本和 Prompt 的语义理解表现不错。一连串动作,都能按 prompt 顺序挨个儿给你实现。

Prompt:空镜从卧室顶部 45 度俯拍,一位女子躺在凌乱的床上。清晨阳光透过百叶窗在她脸上投下条纹状光影。她闭着眼,用手揉眼睛。然后睁开眼睛, 微笑。

14B 效果:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

1.3B 效果:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

物理规律和质感表现也挺不错,这个切柠檬的影子变化、刀面纹理,还有切下去的质感,真实感拉满。

Prompt:高速摄影拍摄一个新鲜柠檬被切开的瞬间。镜头推进,从中景到特写。锋利的银色水果刀从上方切下,柠檬汁飞溅而出,形成细小水珠。特写画面呈现柠檬的横切面和果肉纹理。

14B 效果:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

1.3B 效果:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

然后就是万相 2.1 刚上线通义的时候,不少人吹的运动表现。

我测下来,虽然还说不上是版本 T0,但优点确实也挺明显。大幅度的动作、旋转还有动作的速度,都很猛。

Prompt:在冰面上,一位 18 岁的中国美少女明星短道速滑运动员熠熠生辉。她五官玲珑,神色自信,肌肤胜雪,高马尾充满活力。她身着一条薄荷绿的超短薄纱裙,裙摆随风飘动,上身搭配白色露脐运动背心。以全景镜头俯拍,通过轨道车拍摄跟行。柔和的淡蓝色灯光从斜前方洒下,光质轻柔,光比偏小,营造出清新的氛围。她身姿矫健地疾驰,临近终点时采用推镜头特写其坚毅的眼神和快速摆动的手臂。

14B:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

1.3B:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

2.1 还可以直接实现运镜效果,连复杂的遮挡物运镜都行。

Prompt:低机位拍摄图书馆书架,前景书本缝隙间闪过金丝眼镜的反光。当镜头水平移过三格书架,穿灰色毛衣的男生恰好转头,看向镜头,手中悬停的棕色书本封皮。

14B:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

1.3B:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

还有必须提一下的文字生成,万相是全世界第一个能直出中文字的,现在能在 AI 视频里,直接生成中文的 AI 视频模型太少了。

Prompt:以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画边缘模糊且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出独特的东方韵味。背景高级简洁,杂志摄影感。

14B 效果:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

1.3B 效果:

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

不过文字生成还是有待改进,亲测目前只能支持生成非常简单的、笔画数少的中文,可以实现的字体也比较少,复杂点的文字内容还是容易出现乱码和鬼画符。不过没关系,这只是刚开始,万相继续加油吧,这个方向是非常实用的。

整体来说,万相 2.1 语义理解和物理表现都很稳,画面审美也在基准之上。

而且不要忘了,这玩意可是开源的。。。

对与生态的加持,想象空间太大了。

如果你现在想用万相 2.1 的话,有几种使用方式。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

先说 14B 的,14B 的你可以跟我一样,直接去官网免费用,每天签到有 50 灵感值,如果你在 APP 上跑一个视频的话每天可以再加 50 灵感值。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

1 个专业版(14B 720P)的视频,5 灵感值,也就是说,你其实一天可以白嫖 20 个视频了。

然后就是 Hugging Face 上的 demo,虽然是可以所谓的无限免费用,但是算力太少人太多,基本约等于用不了,可以直接放弃。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

还有就是去阿里云百炼,接 API 用: https://bailian.console.aliyun.com/model-market#/home

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

价格的话,Plus(2.1 专业版)是每秒 0.7 元,Trubo(2.1 极速版)是每秒 0.24 元。

然后就是 1.3B,如果你本身有 8G 以上的显卡,那就无脑直接本地化自己部署就行了。

具体的可以去他们 github 上看。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

其实我最期待的,还是关于 ComfyUI 的集成,如果这能接进去,那就可以玩很多的花活了。

最后,我还是想表达一下对阿里的敬佩。

AI 领域的半壁江山,现在几乎都是阿里的。

Qwen 作为老大哥遥遥领先,新秀万相补上 AI 视频的空白,现在全世界,都知道了阿里的名号。

而且不止是 AI 圈,金融圈,更是因为阿里在 AI 上的策略,全世界的资本开始重新关注过来。

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

你就看看阿里涨了多少吧,带着恒生科技和中概互联又飞了多少吧。

中国资产的全面复苏。

正是因为前几天阿里炸裂的财报,还有 AGI 的决心,让全球的投资者都认识到,中国的宏观、行业、企业在节点上,都已经完成了对齐。

顺带也告诉全世界:

我们不只在跟跑,我们也开始在领跑了。

未来肯定还会有更多挑战,但如今,我有理由对阿里,对 DeepSeek,对整个中国的 AI 产业抱以更大的信心。

最后,用一句话收尾吧:

源神之名。

当之无愧。

欢迎关注作者的微信公众号:数字生命卡兹克

阿里深夜开源万相2.1,这是AI视频领域的DeepSeek!

相关资讯

DeepSeek+ComfyUI 一天出爆款!如何用AI全流程创作短视频?

短视频时代,AI 工具已经成为设计师和视频创作者的“神助攻”! 尤其是像 DeepSeek 这样的 AI 平台,凭借其强大的 AI 创作能力,正在改变全行业创作的面貌。 今天,我们将通过一个实际案例——制作一个在抖音投放的短视频,来分享如何利用DeepSeek comfy UI 可灵,高效产出AI视频内容。

2025最好用的AI产品大全推荐,看这一篇就够了!

2025 年了,马上我的公众号两周年就要到了。 这两年,承蒙各位粉丝和品牌方的厚爱,我测试了无数的公开的未公开的 AI 产品,前几天算了下身上的保密协议金额累计都快 2000 万了。 但是如果你问我,这两年被问过最多的问题是什么。

内测即爆火!一键超清修复老视频的AI神器Starlight

经常有群友问我有没有什么把视频修复的工具。 而我过去最推荐的,也是我心中目前最牛逼的视频修复工具,自然就是 TopazVideoAI 了。 这玩意儿我 2023 年就写过教程。