AI视频生成这么强?带你快速了解发展概况和应用场景!

AI 生成视频发展到什么程度了,效果如何?有哪些可用的产品方案?网上炫酷的效果如何实现?AI 视频的应用场景和案例有哪些? 本着对以上问题的探索,我开启了 AI 视频系列的探索。上篇将着重介绍技术发展概况和应用场景思考。 更多AI视频生成神器介绍:一、技术发展概况 长期以来,人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。随着 AI 图像领域的技术发展,AI 视频技术也逐渐取得了突破。本节内容结合 Claude、Perplexity 查询、项目论文整理而成。 1. 生成方法 从交互方式来看,当前 A

AI视频生成这么强?带你快速了解发展概况和应用场景!

AI 生成视频发展到什么程度了,效果如何?有哪些可用的产品方案?网上炫酷的效果如何实现?AI 视频的应用场景和案例有哪些?

本着对以上问题的探索,我开启了 AI 视频系列的探索。上篇将着重介绍技术发展概况和应用场景思考。

更多AI视频生成神器介绍:

一、技术发展概况

长期以来,人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。随着 AI 图像领域的技术发展,AI 视频技术也逐渐取得了突破。本节内容结合 Claude、Perplexity 查询、项目论文整理而成。

1. 生成方法

从交互方式来看,当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式。

一些视频生成方法是先生成静态关键帧图像,然后构建为视频序列。也存在直接端到端生成视频的技术,无需进行多阶段处理即可生成视频,如基于 GAN、VAE、Transformer 的方法。

当视频在手机上无法加载,可前往PC查看。

微软 NUWA-XL:通过逐步生成视频关键帧,形成视频的“粗略”故事情节,然后通过局部扩散模型(Local Diffusion)递归地填充附近帧之间的内容。

2. 关键帧 + 补间技术方式间的差异

代表产品:Deforum、AnimateDiff、Rerender a Video

(1)关键帧生成方式很多,主要通过各种 AI 生成图片的方式解决,最主流的方式是 Stable Diffusion,可最大程度的保证不同帧风格一致,在下文中会详细介绍实操案例。

(2)补帧算法:主要用于平滑关键帧之间的动作和细节。

光流补帧:通过计算两帧图像之间每个像素的运动向量,根据光流场生成中间帧。优点是计算量较小,速度快。代表产品是 EbSynth。

基于姿态补帧:利用人体关键点检测计算姿态信息(关节位置、角度等信息),进行中间帧图像合成。适合为具有复杂运动的复杂对象或角色制作动画。

重参考补帧:使用相邻的后向和前向帧作为参考,通过双向帧信息进行像素级补帧。

(3)完善策略: 进一步提升生成视频的整体质量和连贯性,协同补帧算法,弥补关键帧生成可能存在的各类缺陷。不同模型使用的方法有所差异。

渐进补帧:通过迭代多次补帧完善视频质量,逐步提升分辨率和连贯性。

递归框架:递归完善每一帧,直到达到质量要求。

增强后处理:使用图像增强 GAN 等技术,对生成的视频进行修复和提升,特别提升存在模糊、残影等问题的区域,增强整体质量。

对比学习:指学习和对比真实高质量视频数据,从中提取提升生成视频细节的模式。

模糊处理:使用滤波、平滑等算法处理生成视频,减少帧间的不连贯引起的毛刺和锯齿问题,增强视觉流畅性。

融合多个模型:不同模型生成相同视频,进行模型融合。

3. 端到端视频生成的技术差异

代表产品:Runway

GAN 生成对抗网络:

是一种无监督的生成模型框架,通过让两个神经网络相互博弈来进行机器学习。可以生成视觉逼真度高的视频,但控制难度大、时序建模较弱。

VAE 变分自编码器:

它是一种可以学习数据分布的网络结构。就像把视频文件压缩成较小的文件再解压一样,它可以重建视频数据。VAE 可以根据条件输入控制生成过程,但质量较 GAN 略低。

GAN、VAE 生成视频速度快,缺点是生成质量和分辨率较低,长度短,控制能力弱。

Transformer 自注意力机制:

通过学习视频帧之间的关系,理解视频的长期时间变化和动作过程,这种方式对长视频建模更好,时序建模能力强,可实现细粒度语义控制,缺点是计算量大。

4. AI 视频生成当前面临的问题

当前仍面临生成时间长、视频质量不稳定,生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案有:

使用渐进生成、增强时序一致性的模型等方法解决。

上述的补帧算法、视频完善策略也可在一定程度上缓解问题。

二、应用场景思考

1. 现阶段应用场景

在盘点完全部产品后,我感受到 AI 视频产品目前面向的主要受众群体有:

(1)专业创作者(艺术家、影视人等):

AI 生成能够为作品赋予独特风格和想象力,为创作者提供灵感,配合高超的剪辑技巧和叙事能力,便可以制作出超乎想象的效果。低成本动捕更是能够大幅降低后期制作的门槛和成本,自动识别背景生成绿幕、视频主体跟随运动等能够辅助视频编辑,为后期制作增加更多空间。

目前该应用主要集中在音乐 MV、短篇电影、动漫等方向。

一些 AI 视频平台也积极寻求创意合作,为创作者提供免费支持。

当视频在手机上无法加载,可前往PC查看。

@valleeduhamel 使用现有的素材、Gen-1 和大量合成创作了新电影《After Light》的过程分享

当视频在手机上无法加载,可前往PC查看。

Ammaar Reshi 的团队使用 Stable WarpFusion + Davinci Resolve 制作完整的动漫剧情,制作过程分享

(2)自媒体、非专业创作者:

这部分人群通常有着非常具体且明确的视频剪辑痛点。

a. 比如科技、财经、资讯类重脚本内容的视频在制作时需花费大量时间寻找视频素材、还需注意视频版权问题。一些产品(Invideo AI、Pictory)已经在发力脚本生成分镜、视频,帮助创作者降低视频素材制作门槛。

Gamma AI 已经实现了文章高效转 PPT 的能力,若能结合 Synthesia、HeyGen AI、D-ID 等产品的 Avatar、语音生成能力也可快速转化为视频内容。

当视频在手机上无法加载,可前往PC查看。

b.不同平台适合不同内容形式,创作者想要将同一个素材在不同平台分发就意味着制作成本的升高。而 OpusClip 提供的长视频转短视频致力于解决这一痛点。

当视频在手机上无法加载,可前往PC查看。

(3)企业客户:

对于没有足够视频制作资金的小企业、非盈利机构来说,AI 视频生成可以为其大幅缩减成本。

想要制作低成本的营销视频、企业宣传视频、培训课程,可以使用 Synthesia、HeyGen AI、D-ID 等产品,用 Avatar 代替真人出镜。

又如出海企业需要给产品(商品)推广、介绍使用体验,早在 21 年,诗云马良平台就推出了给视频中模特换脸、切换语言的能力,方便电商营销商家进行产品的本地化推广。近期 HenGen AI 也公布了 AI 切换视频内语言的能力,并且能够将 Avatar 口型与视频相匹配。

AI视频生成这么强?带你快速了解发展概况和应用场景!

在互联网设计工作流中的应用畅想

在互联网产品设计领域,设计师的工作主要涉及宣传视频、3D 动画、页面动画、图标动画制作,且产出内容需具备具体需求场景下落地的要求。

目前 Move AI 这样的产品让我看到了在游戏和产品设计工作中大幅降低 3D 动画制作成本的可能。未来设计师可能只需要拍摄特定动作并映射到制作好的 3D 模型中,快速制作动画方案。

AI视频生成这么强?带你快速了解发展概况和应用场景!

By Mark Peart

目前,Figma、Protopie 等产品支持的智能动画功能已经能够基于补间算法,在用户仅定义动画的开始和结束状态的情况下自动生成中间帧。未来不排除实现通过文字更加精确的控制动画的可能。

AI视频生成这么强?带你快速了解发展概况和应用场景!

下一篇中,我们将着重了解每个产品的特点和具体使用方法,也会通过实践案例展示效果。

相关资讯

Runway Gen-3的视频转绘功能太牛了!大片制作0门槛!

大家好我是花生~ Runway 在推出 Gen-3 Alpha 视频生成模型后,还一直有一些小的更新,比如推出了新的 Turbo 模型,生成速度比原来快了 7 倍;支持尾帧控制;支持将视频延长至 40s 等,都是非常符合用户需求的优化提升。 而它前几天推出的 V2V (Video to Video) 功能,更是将 AI 视频在风格转绘上的水平提升到了一个新的高度,再次秀了一波「AI 视频生成王者」的实力。该功能一经推出就受到众多专业 AI 视频创作者的称赞,并迅速衍生出多种玩法,很有潜力成为一个新的流量风口,喜欢

Runway 王炸更新!5个笔刷让人人都能成为神笔马良

前言 上周 Runway 再次升级 Gen-2「运动笔刷」更名为「多头运动笔刷」(Multi Motion Brush),这次可以说是 AI 视频可控性的王炸进化!5 个笔刷,可以对视频局部调整,人人秒变神笔马良。 目前所有用户都可以免费使用,额度 100 秒,每使用一次消耗 4 秒。 接下来让我们一起来试一试吧。 更多AI视频干货:一、使用体验 目前,Runway 可以在官网上或者下载手机 APP 使用。 1. 登录网址 打开官网: 进入 Runwayml 主页,点击图片上的粉色「Start with imag

Runway!AI技术+视频制作的新一代视频内容生成工具

大家好,这里是和你们聊设计的花生~ 之前和大家聊过不少 AI 图像生成工具,有的可以根据文本生成图像,有的则是将 AI 技术运用到图像处理中,让扣除背景、消除画面元素成为非常轻松快速的事情,大大提升了设计师的工作效率。既然 AI 技术在图片处理的应用上如此成熟,那如果用到视频的剪辑制作上会有什么效果呢? Runway 官网: AI 技术的快速消除图像内容 比如在视频里实现一键抠图,将人物从背景中分离出来,进行背景更换或者插入文字图层:或者在视频里实现快速修图,用画笔一抹,就能去除视频中不需要的部分:甚至在视频里也