视频生成
Gemini 或将支持视频生成?Google 应用代码泄露玄机
据国外媒体Android Authority报道,谷歌正持续为其 AI 数字助理 Gemini 增加新功能。 继深度情境理解、文件处理优化以及跨应用链接等功能后,Google 应用程序中的代码表明 Gemini 很快就能生成视频。 Google 应用 v16.6.23版本代码中暗示了这一新功能。
港大字节最新视频生成模型刷屏!网友直接RIP市场营销,Sora也不香了
刚刚,港大字节联手发布最新视频生成模型,让歪果网友直呼疯狂。 有人甚至直接RIP市场营销、TikTok用户和YouTube创作者。 你敢信,下面这一幕不是来自欧巴电视剧,而是AI生成的!
Meta 新视频生成框架 VideoJAM 拿捏倒立杂技,双人舞也能完美同步
针对视频生成中的运动一致性难题,Meta GenAI 团队提出了一个全新框架 VideoJAM。VideoJAM 基于主流的 DiT 路线,但和 Sora 等纯 DiT 模型相比,动态效果直接拉满。
可灵视频生成可控性为什么这么好?快手又公开了四篇研究
可灵,视频生成领域的佼佼者,近来动作不断。 继发布可灵 1.6 后,又公开了多项研究揭示视频生成的洞察与前沿探索 ——《快手可灵凭什么频繁刷屏? 揭秘背后三项重要研究》。
快手可灵凭什么频繁刷屏?揭秘背后三项重要研究
“可灵(KLING)”,近半年来频繁亮相于国内外各大科技媒体,已然成为科技感与创意的代名词,它代表了快手 AI 团队在视频生成领域的前沿探索。 作为全球首个可公开体验的真实影像级视频生成大模型,可灵于 2024 年 6 月 6 日正式发布并上线。 在短短半年多的时间里,可灵已完成了数十次功能与效果的升级迭代,始终稳居全球视频生成领域的第一梯队,持续引领着行业效果的提升。
Open-Sora:让所有人都能轻松制作高效视频,可生成16秒720P视频,模型代码全开源!
Open-Sora是一项致力于高效制作高质量视频的计划。 目的是让所有人都能使用模型、工具和所有细节。 通过采用开源原则,Open-Sora 不仅使高级视频生成技术的使用变得民主化,而且还提供了一个简化且用户友好的平台,简化了视频生成的复杂性。
MinT: 第一个能够生成顺序事件并控制其时间戳的文本转视频模型。
本文经AIGC Studio公众号授权转载,转载请联系出处。 MinT 是第一个能够生成顺序事件并控制其时间戳的文本转视频模型。 使用 MinT 生成时间控制的多事件视频。
潞晨尤洋:视频生成的GPT-4时刻,3年后可以见证 | MEET 2025
奥特曼说,Sora代表了视频生成大模型的GPT-1时刻。 从开年到现在,国内外、初创独角兽到互联网大厂,都纷纷投入视频生成领域,带来一个个新鲜模型的同时,视频、影视行业也随之发生巨变。 不可否认,当下的视频生成模型还遇到诸多问题,比如对空间、对物理规律的理解,我们都期待着视频生成的GPT-3.5/4时刻到来。
北航&清华联合发力!Stag-1:视频生成模型实现超逼真的4D驾驶场景算法!
写在前面&笔者的个人理解近年来,随着自动驾驶在感知、预测和规划方面取得的重大进步,端到端算法网络也取得了重大进展。 随着现如今这些技术的飞速进步,自动驾驶汽车的全面测试和验证也变得越来越重要。 然而,真实世界的车辆测试仍然耗时、费用昂贵,并且场景的覆盖范围也非常有限。
OpenAI被偷家,谷歌Veo 2反超Sora
视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。 几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生图模型,可更忠实地遵从提示词,实现更加丰富的细节和纹理渲染;Whisk:图生图工具,基于 Imagen 3 与 Gemini 的视觉理解和描述能力打造,能让用户更加方便地调整图像的场景、风格和物体。
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
3 个月前,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。 只用了 5 周时间,海螺 AI 的网页版访问量便增速超 800%,还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。 一时间,不少国内网友直呼其为“国产之光”。
二次元狂喜!海螺发布2D动画专用视频生成模型,日漫迪士尼插画风都支持
MinMax海螺AI新模型,让2D角色动起来了! 日漫、游戏、插画等各种风格的静态人物,都可以丝滑地转变成生动的2D风格视频。 量子位也马上上手实测了一波——首先请出今年的顶流悟空先生,输入下面的prompt(输入时是英文,此处意译):悟空在波涛汹涌的海面上准备战斗,金箍棒闪着金光,衣摆随风被吹动,气氛紧张来看看海螺的生成效果:不得不说,还真有大片里面战斗即将开场的即视感了!
中国电信发布首个央企全自研视频生成大模型,与华为、中兴等成立 AI 联盟
TeleAI 发布视频生成大模型、视觉大模型产用一体化平台、具身智能、智传网等一系列创新技术、产品及科研成果,并发布开发者产业联盟计划。
张军:腾讯混元大模型 12 月 3 日将上线视频生成能力
腾讯公司公关总监张军今天傍晚宣布,腾讯混元大模型12 月 3 日正式上线视频生成能力,用户可以在腾讯元宝App中提交申请试用。
王炸!谁能想到年底杀出的黑马是美图啊
今年的AI界依旧让人眼花缭乱,但迈入“应用年”后,大家更加关注落地。 就像年初OpenAI发布的Sora至今未向公众开放,被戏称“期货”,再酷炫的技术,用不上也没用。 和大把热衷炫技的公司不同,小而美的美图属于“闷声干大事”。
开源视频生成天花板?最强搅局者Mochi 1免费直出电影级特效
AI视频生成赛道最强搅局者,来了! 何谓搅局? 下面这些是模型直出的效果,开源免费送给你!
实测13个类Sora视频生成模型,8000多个案例,一次看个够
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2024 最全合集!13个AI视频产品评测&实战效果!
前言 - AI 视频闭源产品近半年发展
Sora 之后,DiT 架构成为视频生成产品的主流技术。这大半年里,横空出世的 Luma AI、Kling 成为视频生成领域最大黑马,而老牌选手 Runway 也推出了实力强劲的 Gen3 模型。AI 视频生成在画面表现力、语义理解、清晰度、可控性方面有了大幅提升,同时多家产品在音画同步、笔刷等工具上做了更新,提升了产品可控性。
这篇文章会带大家了解 AI 视频产品的最新能力,不同产品的优势,以及展示各个产品的实测效果。
这个系列预计分为闭源、开源两篇。以下是本文目录:一、先