视频训练LoRA来了!Ostris 用 20 张照片打造惊艳 Wan 2.1 LoRA

2025年3月9日,美国加利福尼亚州——开源模型正让文生视频技术变得越来越有趣。 AI 开发者 Ostris(@ostrisai)近日在 X 平台上分享了他使用自家照片训练的 Wan2.1LoRA 模型成果,仅凭约20张照片和一块家用 RTX4090显卡,便实现了令人惊叹的视频生成效果。 这一成果不仅展示了开源技术的潜力,也引发了 X 社区对视频 LoRA 训练工具的热烈讨论。

2025年3月9日,美国加利福尼亚州——开源模型正让文生视频技术变得越来越有趣。AI 开发者 Ostris(@ostrisai)近日在 X 平台上分享了他使用自家照片训练的 Wan2.1LoRA 模型成果,仅凭约20张照片和一块家用 RTX4090显卡,便实现了令人惊叹的视频生成效果。这一成果不仅展示了开源技术的潜力,也引发了 X 社区对视频 LoRA 训练工具的热烈讨论。

image.png

Ostris 的惊艳实验

Ostris 在3月7日的 X 帖子中首次展示了 Wan2.114B LoRA 的训练成果。他写道:“Wan2.114B LoRA 训练在24GB 上成功运行!在4090上以480p 分辨率平均每步1.7秒。”他还分享了一段初步视频,证明了这一模型在家用硬件上的可行性。随后在3月9日,他进一步发布了一段“低成本概念验证短音乐视频”,搭配自己创作的歌词和 @SunoMusic 生成的音乐,视频中的数字人形象正是基于他自己的照片训练而成。

Ostris 表示,他仅使用了约20张个人照片,通过其开发的视频 LoRA 训练工具完成了这一过程。他在帖子中感叹:“没想到效果这么好!我玩得很开心。”这一实验不仅验证了 Wan2.1LoRA 的强大性能,也展示了普通用户利用开源工具实现高质量文生视频的可能性。

训练工具开源共享Ostris 开发的视频 LoRA 训练工具成为此次发布的一大亮点。用户 @sundyme 在3月9日发帖称:“视频 LoRA 训练来了,让你成为 AI 视频的主角!”并分享了 Ostris 的工具链接。这一工具支持 Wan2.1模型,允许用户通过少量照片训练个性化视频模型,显著降低了技术门槛。

X 用户对这一工具表现出浓厚兴趣。@sundyme 表示:“由 @ostrisai开发的 LoRA 训练工具,支持 Wan2.1,效果惊艳。”社区反馈显示,该工具在 RTX4090等消费级显卡上的高效运行,让更多创作者能够在家尝试 AI 视频生成。

社区反响与技术意义

X 上的反响显示,Ostris 的成果激起了广泛热情。一名用户评论:“用20张照片就能训练出这么逼真的数字人,太不可思议了!”另一位用户则称赞开源模型的潜力:“文生视频越来越有趣了,开源让普通人也能玩转 AI。”

业内人士认为,Ostris 的实验凸显了开源模型在视频生成领域的突破。Wan2.1LoRA 结合少样本训练技术,不仅降低了硬件需求,还提升了个性化创作的可及性。与传统需要庞大数据集和高性能服务器的模型相比,这一方法为独立开发者和小型团队开辟了新路径。

项目地址:https://github.com/ostris/ai-toolkit

相关资讯

显卡市场硝烟再起:Nvidia RTX5070 发布推迟,AMD或有后招

显卡市场即将迎来新一轮的激烈竞争。 Nvidia对其即将推出的RTX5070显卡寄予厚望,声称其性能可媲美RTX4090,而售价仅为549美元。 然而,这一说法是否属实,还有待市场检验。

通义万相开源视频生成模型Wan2.1:8.2G显存即可生成480P视频

近日,通义宣布开源其最新的通义万相大模型 Wan2.1。 Wan2.1是一款专注于高质量视频生成的 AI 模型,凭借其在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面的卓越表现,成为了创作者、开发者和企业用户拥抱 AI 时代的首选工具。 在权威评测集 Vbench 中,通义万相 Wan2.1以总分86.22% 的成绩登顶榜首,大幅领先国内外其他知名视频生成模型,如 Sora、Minimax、Luma、Gen3和 Pika 等。

阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行

近日,阿里巴巴在深夜推出了全新的开源视频生成模型 Wan2.1,该模型凭借14B 的参数量迅速占据了 VBench 榜单的顶端,成为目前视频生成领域的佼佼者。 与此之前发布的 QwQ-Max 不同,Wan2.1在复杂运动的细节处理上表现出色,能够流畅地实现多个人物的同步舞蹈,令人惊叹不已。 官方演示中,Wan2.1不仅成功克服了静态图像生成中的难题,如文字的处理更是达到了新的高度。