视频生成
快手可灵凭什么频繁刷屏?揭秘背后三项重要研究
“可灵(KLING)”,近半年来频繁亮相于国内外各大科技媒体,已然成为科技感与创意的代名词,它代表了快手 AI 团队在视频生成领域的前沿探索。 作为全球首个可公开体验的真实影像级视频生成大模型,可灵于 2024 年 6 月 6 日正式发布并上线。 在短短半年多的时间里,可灵已完成了数十次功能与效果的升级迭代,始终稳居全球视频生成领域的第一梯队,持续引领着行业效果的提升。
Open-Sora:让所有人都能轻松制作高效视频,可生成16秒720P视频,模型代码全开源!
Open-Sora是一项致力于高效制作高质量视频的计划。 目的是让所有人都能使用模型、工具和所有细节。 通过采用开源原则,Open-Sora 不仅使高级视频生成技术的使用变得民主化,而且还提供了一个简化且用户友好的平台,简化了视频生成的复杂性。
MinT: 第一个能够生成顺序事件并控制其时间戳的文本转视频模型。
本文经AIGC Studio公众号授权转载,转载请联系出处。 MinT 是第一个能够生成顺序事件并控制其时间戳的文本转视频模型。 使用 MinT 生成时间控制的多事件视频。
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025
奥特曼说,Sora代表了视频生成大模型的GPT-1时刻。 从开年到现在,国内外、初创独角兽到互联网大厂,都纷纷投入视频生成领域,带来一个个新鲜模型的同时,视频、影视行业也随之发生巨变。 不可否认,当下的视频生成模型还遇到诸多问题,比如对空间、对物理规律的理解,我们都期待着视频生成的GPT-3.5/4时刻到来。
北航&清华联合发力!Stag-1:视频生成模型实现超逼真的4D驾驶场景算法!
写在前面&笔者的个人理解近年来,随着自动驾驶在感知、预测和规划方面取得的重大进步,端到端算法网络也取得了重大进展。 随着现如今这些技术的飞速进步,自动驾驶汽车的全面测试和验证也变得越来越重要。 然而,真实世界的车辆测试仍然耗时、费用昂贵,并且场景的覆盖范围也非常有限。
OpenAI被偷家,谷歌Veo 2反超Sora
视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。 几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生图模型,可更忠实地遵从提示词,实现更加丰富的细节和纹理渲染;Whisk:图生图工具,基于 Imagen 3 与 Gemini 的视觉理解和描述能力打造,能让用户更加方便地调整图像的场景、风格和物体。
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
3 个月前,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。 只用了 5 周时间,海螺 AI 的网页版访问量便增速超 800%,还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。 一时间,不少国内网友直呼其为“国产之光”。
二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持
MinMax海螺AI新模型,让2D角色动起来了! 日漫、游戏、插画等各种风格的静态人物,都可以丝滑地转变成生动的2D风格视频。 量子位也马上上手实测了一波——首先请出今年的顶流悟空先生,输入下面的prompt(输入时是英文,此处意译):悟空在波涛汹涌的海面上准备战斗,金箍棒闪着金光,衣摆随风被吹动,气氛紧张来看看海螺的生成效果:不得不说,还真有大片里面战斗即将开场的即视感了!
中国电信发布首个央企全自研视频生成大模型,与华为、中兴等成立 AI 联盟
TeleAI 发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。
张军:腾讯混元大模型 12 月 3 日将上线视频生成能力
腾讯公司公关总监张军今天傍晚宣布,腾讯混元大模型12 月 3 日正式上线视频生成能力,用户可以在腾讯元宝App中提交申请试用。
王炸!谁能想到年底杀出的黑马是美图啊
今年的AI界依旧让人眼花缭乱,但迈入“应用年”后,大家更加关注落地。 就像年初OpenAI发布的Sora至今未向公众开放,被戏称“期货”,再酷炫的技术,用不上也没用。 和大把热衷炫技的公司不同,小而美的美图属于“闷声干大事”。
开源视频生成天花板?最强搅局者Mochi 1免费直出电影级特效
AI视频生成赛道最强搅局者,来了! 何谓搅局? 下面这些是模型直出的效果,开源免费送给你!
实测13个类Sora视频生成模型,8000多个案例,一次看个够
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2024 最全合集!13个AI视频产品评测&实战效果!
前言 - AI 视频闭源产品近半年发展
Sora 之后,DiT 架构成为视频生成产品的主流技术。这大半年里,横空出世的 Luma AI、Kling 成为视频生成领域最大黑马,而老牌选手 Runway 也推出了实力强劲的 Gen3 模型。AI 视频生成在画面表现力、语义理解、清晰度、可控性方面有了大幅提升,同时多家产品在音画同步、笔刷等工具上做了更新,提升了产品可控性。
这篇文章会带大家了解 AI 视频产品的最新能力,不同产品的优势,以及展示各个产品的实测效果。
这个系列预计分为闭源、开源两篇。以下是本文目录:一、先
消失近半年后, Pika 带着它的新模型和病毒式营销回来了
大家好,我是花生~
国庆长假已经结束了,大家过得开心吗?在我们享受闲暇假期的时候,AI 的发展可是一点儿都没缓下来,接连出现了多款新的模型和工具。今天就和大家聊聊最近再次爆火出圈的 AI 视频生成工具 Pika,看看它是如何在消失近半年后,借助新的模型和营销策略,重新回归的 AI 视频头部地位的。
了解 15 月前刚发布的 Pika :一、新的 Pika 1.5 模型
Pika 官网:
之所以说是 “再次”,是因为去年 7 月份的时候,我就给大家介绍过 Pika 了。那个时候它刚刚推出,凭借不错的视频质量和丰富的
谨以此文,向飞天奖的AI整活视频「致敬」
AI好好用报道编辑:杨文5款对口型的AI产品,总有一款适合你。AI 最大的受害者,原来是娱乐圈的明星们。咋回事呢?前段时间,飞天奖官方整了个花活儿,让明星和电视剧中的 AI 角色合唱了一首《中国梦・我的梦》。那效果,简直一言难尽……(视频来源:B 站博主神仙颜颜_)视频链接:「扎心」:这个东西一端上来就有种淡淡的疯感。台下明星笑得最真心的一次。天呐唐嫣那个... 我都想替她报警了。每一个都好离谱又恐怖,李沁都没牙齿了。不会整就不要整啊,太抽象了,我真的是哈哈哈哈哈哈哈。第一个胡歌出来我就没绷住。笑死我了,满脑子都是
厉害了!Adobe新出Firefly视频模型,2分钟速成高清大片
在 Sora 加入 Adobe 全家桶数月后,Adobe 终于推出了自己的视频生成模型。随着大家对新鲜、短视频内容的需求不断增长,编辑、电影制作人和内容创作者被要求在更短的时间内创作出更好的作品。如今,编辑不仅要剪辑图片,还要进行色彩校正、动画渲染、音频混合等,这些内容大大增加了工作时间。刚刚,Adobe 宣布推出 Firefly 视频模型。Adobe 旨在利用 AI 强大的功能帮助视频内容创作者扩展他们的创意,在客户要求的时间内提供高质量的成果。在官方博客中,Adobe 进行了一系列 Demo 展示,从提示到成片
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都能生成的非常自然,让网友直呼哈利波特的魔法也不过如此。Loopy 模型采用了 Diffusion 视频生成框架。输入一张图片和一段音频,就可以生成相应的视频。不但可以实现准确的音频和口型同步,还可以生成细微自然的表情动作,例如人物跟随情绪节奏做出抬眉、吸气、憋嘴停顿、叹气、肩膀运动等非语言类动作也能很好地被捕捉到;在唱歌时也能表现得活灵活现