视频生成

保姆级教程！小学生看了都会的AI视频短片制作教程

前言我相信这是一篇针对大朋友、小朋友都通俗易懂的视频剧本构思到视频落地的全流程拆解教程。基于大语言模型和绘图模型的前提，有了一次和小伙伴们探索文生图到图生视频的创作实践。废话不多说，直接上保姆级干货教程！保证你能够轻松学会！学之前，快来看看我们制作的视频短片吧~当视频在手机上无法加载，可前往PC查看。一、前期准备 1. 确定主题针对于现有的 AI 生成能力，央视推出了多组 AI 视频短片，为此我们也决定生成一个符合时代主旋律的 AI 小视频。经过脑暴阶段，有了一带一路背景下丝绸之路这个角度的创作故事。创作方向

7/11/2024 6:40:27 AM

桂大羊

人刚毕业，颠覆整个AI界：扒一扒Sora两带头人博士论文

看看这个时代最伟大 AI 学者的研究脉络。2024 年是生成式 AI 元年，才到 2 月，OpenAI 就用 Sora 把竞争推向了视频生成的新高度。我们都还记得初见 Sora 作品时受到的震撼，感叹其他竞争对手想要赶上 OpenAI，至少也得需要个半年到一年的时间。Sora 发布后，其开发团队自然也成为关注焦点，人们都想知道具有跨时代意义的 AI 技术是如何被开发出来的。DiT 模型作者谢赛宁曾表示：「他们每天基本不睡觉高强度工作了一年」。随着时间推移，答案正被慢慢揭晓。以下是 OpenAI 技术报告中，Sora

7/1/2024 3:29:00 PM

机器之心

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

DiT 都能用，生成视频无质量损失，也不需要训练。实时 AI 视频生成来了！本周三，新加坡国立大学尤洋团队提出了业内第一种可以实时输出的，基于 DiT 的视频生成方法。该技术名为 Pyramid Attention Broadcast （PAB）。通过减少冗余注意力计算，PAB 实现了高达 21.6 FPS 的帧率和 10.6 倍的加速，同时不会牺牲包括 Open-Sora、Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。值得注意的是，作为一种不需要训练的方法，PAB 可

6/28/2024 2:55:00 PM

机器之心

Luma、Runway轮番炸场，视频生成卷出新高度，Sora还能称霸吗？来这场WAIC视频生成论坛寻找答案

2023 年 PIKA 发布时，马斯克曾论断称 2024 年将是「人工智能电影」元年。年初 Sora 惊艳亮相、大杀四方，接着 Stable Video Diffusion 、LTX Studio、谷歌 Veo 轮番炸场，再到近期的可灵、Luma 和 Runway 隔空斗法……短短半年时间，众多 AI 视频应用如雨后春笋般涌现，不仅将视频生成技术推向了新的高度，而且拓展了 AI 视频的应用范围，赋予未来更多可能性。如今，发展多模态能力已成为 AIGC 应用的大势所趋，伴随着视频生成技术的不断完善，以及越来越多 AI

6/21/2024 3:23:00 PM

机器之心

AI 在用 | 免费！Adobe一分钟生成火柴人搞笑动画，视频、配音一锅出

机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及工作方式，但绝大部分人依然不知道该如何使用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能使用案例，来具体介绍AI使用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。视频链接：：抖音博主「英英漫」视频链接：：抖音博主「英英漫」大家是不是还在纳闷，这类视频到底是咋个搞出来滴？巧了，最近，小编捡到一个好东西 ——Adobe Express。这是 Adobe 公司推出的一款在线图形设计工具，它允许用

6/12/2024 6:02:00 PM

机器之能

支持合成一分钟高清视频，华科等提出人类跳舞视频生成新框架UniAnimate

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]人类跳舞视频生成是一项引人注目且具有挑战性的可控视频合成任务，旨在根据输入的参考图像和目标姿势序列生成高质量逼真的连续视频。随着视频生成技术的快速发展，特别是生成模型的迭代演化，跳舞视频生

6/9/2024 12:45:00 AM

机器之心

清华出品！AI视频神器 Vidu 横空出世，效果直追 Sora！

大家好，这里是和你们一起探索 AI 的花生~ 这两天一款名为 Vidu 的视频生成模型火爆网络，它由北京生数科技与清华大学联合发布，能直接通过文本生成 16 秒 1080P 的高清视频，且视频质量与 OpenAI Sora 不相上下，因此被认为是 Sora 目前最有力的竞争对手。 Vidu 内测名额申请： shengshu.feishu.cn当视频在手机上无法加载，可前往PC查看。相关推荐：Vidu 是中国首个具备长时长、高一致性及高动态性的视频大模型，从官方的演示视频中也可以切实感受到其强大的生成能力。对于 “

4/30/2024 8:26:56 AM

夏花生

LTX Studio 最新测评! 颠覆传统的一站式 AI 视频创作神器

大家好，这里是和你们一起探索 AI 的花生~ AI 视频生成工具正在被越来越多地应用到实际创作中，大家应该看过不少用 AI 生成的 “电影预告片”，比如 CCTV6 电影频道发起的 “AI 影像人才优选计划” 中的短片《玉覆荆楚》，效果就非常惊艳。像此类视频一般需要先写好剧本分镜，然后用 Midjourney 或者 SD 出图，再用 Runway 或者 Dreamina 这样的 AI 视频工具分别生成动态，最后再导入 Pr 或者剪映中进行后期编辑处理，最终形成一个完整的短片。不过今天我要为大家介绍一款新的工具 L

4/19/2024 5:42:05 AM

夏花生

全日程发布｜Sora之后的视频生成技术与应用

说起 Sora，相信大家都不陌生。近一个多月内，关于 Sora 的讨论延伸到了各个角落，这个一直没有对外开放的视频生成模型，不仅让人惊艳，更让人焦虑。作为持续关注 AI 技术前沿的团队，机器之心特别策划了「视频生成技术与应用 — Sora 时代」的技术论坛。本次活动聚焦 Sora 发布后的技术创新、思考与应用实践，希望能帮助大家构建一个完整的视频生成知识图谱。面对扑面而来的 AI 视频生成，积极拥抱学习并敢于尝试，才能抓住技术潮流，破局而生。期待 2024.04.13，在北京海淀区，和你相遇。活动全日程论坛报名通道

4/1/2024 11:41:00 AM

机器之心

46秒AI生成真人视频爆火，遭在线打假「换口型、声音」

是炒作还是真正的 AI 视频能力进化？AI 生成视频已经发展到这个程度了吗？前段时间，英国王室凯特王妃的 P 图事件，再次将人们的注意力吸引到了图像或视频造假上来。随着 AI 伪造工具的「进化」，以假乱真、无中生有的内容也随之不断出现。今天，一段宣称完全由 AI 生成的不到 50 秒的视频在社交圈疯传，在「视频是否真由 AI 生成」这一点上，网友更是在评论区吵翻了天。我们先来看这段视频。显然，如果没有提前被告知它由 AI 生成，我们大概率就会认为它就是真实视频。上传者表示，音频和视频都是 AI 生成的，它们出自一款

3/28/2024 11:50:00 AM

机器之心

再谈复现 Sora：被仰望与被遗忘的

2月16日，OpenAI 发布了视频生成领域的重磅模型 —— Sora。Sora 对 Scaling Law 的信仰及其突破性的技术创新，使它持续保持领先地位。同时，也再次证明了“大力出奇迹”依然适用于文生视频领域。Sora 披露的技术细节，远远不足以窥其全貌。同时 Sora 目前也未正式对外开放。源于此，针对 Sora 的思考和讨论从未停止过。 OpenAI 发布的技术报告Sora 给整个 AI 领域带来的最大冲击，莫过于如何优化和校正现有的视频生成思路和

3/27/2024 10:51:00 AM

机器之心

国产AI视频神器 Dreamina 测评！支持中文，效果不输 Runway

大家好，我是花生~ 最近拿到了 AI 创作平台 Dreamina 视频生成功能的内测资格，这也是目前首个支持中文生成视频的 AI 工具，体验下来感觉非常不错，今天就带大家看看它具体的生成效果。相关推荐：Dreamina 官网：（AI 视频生成功能目前处于内测阶段） Dreamina 目前支持文生图和图生图 2 项功能，提示词支持中英文，2-3 分钟就能生成一个 3 秒的视频，这与目前大部分的 AI 视频生成工具差不多。其文生图功能目前的参数设置包括：有静止、推进、拉远、向左旋转、向右旋转 5 种镜头运动可选；

3/20/2024 8:51:28 AM

夏花生

万字干货！Sora 如何如何转化为实际生产力？

2 月 16 日凌晨（北京时间）正月初七，在没有任何消息和预兆下，Open AI 突然发布了首个文生视频大模型——Sora，借此Sora正式对外曝光，AI视频领域也迎来了前所未有的关注度，并且在极短时间内震惊业界，并持续破圈。如今虽然距离 Sora 发布已有 1 个月的时间，但各方对 Sora 大模型的讨论仍在持续，主流业界也对 Sora 基本达成了共识。Sora 到底为什么能够震惊业界？是真的遥遥领先，还是在过度神话？以及我们如何将 Sora 落地应用于实际项目？本篇文章将带你一一了解！引言 Sora 的技术文

3/19/2024 8:41:28 AM

团队新浪MDC

Sora 时代的 AI 视频生成何去何从？

Sora 作为 OpenAI 最新发布的视频生成模型，在全球范围内引起了热烈讨论。距离上一个引发全民讨论的视频生成模型 Pika 1.0 的发布，不到三个月的时间。Sora 生成的视频有着合理的连贯性、视频主体细节足以达到以假乱真的程度。仿佛一夜之间解决了 AI 生成视频的长度、流畅性、逻辑性等问题。Sora 带来的视觉震撼，让「扔进一部小说、出来一部大片」逐步成为现实。技术的突破令人振奋，一度引发了大佬们关于世界模型的讨论，可见 Sora 早已超出了大众对技术上限的想象。与此同时，Sora 带来的恐慌和焦虑也正在

3/7/2024 3:01:00 PM

机器之心

我在模拟世界！OpenAI刚刚公布Sora技术细节：是数据驱动物理引擎

机器之心报道机器之心编辑部先安排好演员，再让他们来演绎。今天，我们都在感受 Sora 的带来的魅力。OpenAI 的首个视频生成模型 Sora，让「一句话生成视频」的前沿 AI 技术向上突破了一大截，引发了业界对于生成式 AI 技术方向的大讨论。Sora 生成的视频范例。提示词：「两艘海盗船在一个咖啡杯中航行、互相战斗的逼真特写视频。」来源：，我们已经见证过许多创业公司提出的视频生成模型。相比之下，OpenAI 提出的新模型不论是效果还是理念上，似乎都具有划时代的意义。有人第一时间总结道，Sora 不是一个简单的视

2/16/2024 5:34:00 PM

机器之能

线上课程开售！暨视频生成前沿研究与应用 AI 技术论坛圆满收官

致力于助力企业和广大从业者掌握 AI 视频生成技术前沿，把握时代机遇的“视频生成前沿研究与应用”——机器之心 AI 技术论坛日前圆满收官。活动当天，北京西城昆仑巢论坛现场门庭若市，来自全国十余个城市的 200 多名参会者亲临现场，在 10 位视频生成领域的技术专家带领下，系统拆解了 AI 视频生成的关键技术，了解并学习了多家国内顶尖团队的技术方案和技术创新，活动的最后依然是两个技术实操来巩固所学知识，高效完成了视频生成技术的积累和升级。快来看看现场的精彩瞬间吧！嘉宾精彩分享每一位嘉宾都带来了精彩的分享，现场收获满满

1/29/2024 11:31:00 AM

机器之心

Runway 王炸更新！5个笔刷让人人都能成为神笔马良

前言上周 Runway 再次升级 Gen-2「运动笔刷」更名为「多头运动笔刷」（Multi Motion Brush），这次可以说是 AI 视频可控性的王炸进化！5 个笔刷，可以对视频局部调整，人人秒变神笔马良。目前所有用户都可以免费使用，额度 100 秒，每使用一次消耗 4 秒。接下来让我们一起来试一试吧。更多AI视频干货：一、使用体验目前，Runway 可以在官网上或者下载手机 APP 使用。 1. 登录网址打开官网：进入 Runwayml 主页，点击图片上的粉色「Start with imag

1/29/2024 12:36:24 AM

yaoyao

参会指南｜倒计时 2 天，AI 视频生成论坛即将开启！

「视频生成前沿研究与应用」机器之心 AI 技术论坛将于本周六（1月20日）正式开启。本次活动是 2024 年机器之心主办的首场线下交流活动，期待到场的朋友们都能收获满满。为了帮助大家更全面、充分地了解大会内容，丝滑参会，机器之心特别整理了一份详细的参会指南，请查收！签到指南签到时间：2024.01.20 09:00-09:25签到地点：北京市西城区设计之都大厦一层昆仑巢签到程序：参会者持活动行签到二维码扫码签到确认后，领取活动日程和参会手环。（二维码和手环是活动结束后领取奖品的必要证明，请注意留存。）午休时间：1

1/18/2024 11:34:00 AM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用全日程揭晓！ICLR 2025论文分享会我们北京见 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本人形机器人 xAI 搜索大语言模型 Copilot 字节跳动神器推荐 LLaMA 具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练