国产文生视频大模型 Vidu 将迎革新：反对生成 32 秒实质、音视频合成

感谢据“钛媒体 AGI”周四报导，生数科技、清华大学联合宣布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大革新，实现“重大技术迭代”。主要革新实质如下：反对一键生成 32s 视频反对音视频合成，“视频有声音了”（Text-2-Audio）反对 4D 生成，可以从单一视频生成时空一致的 4D 实质IT之家附部分视频预览：据介绍，Vidu 是自 Sora 宣布之后，全球率先取得重大突破的视频大模型，并且仍在加速迭代提升中。据IT之家此前报导，Vidu 模型融合 Diffusion

感谢据“钛媒体 AGI”周四报导，生数科技、清华大学联合宣布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大革新，实现“重大技术迭代”。

主要革新实质如下：

反对一键生成 32s 视频

反对音视频合成，“视频有声音了”（Text-2-Audio）

反对 4D 生成，可以从单一视频生成时空一致的 4D 实质

IT之家附部分视频预览：

据介绍，Vidu 是自 Sora 宣布之后，全球率先取得重大突破的视频大模型，并且仍在加速迭代提升中。

据IT之家此前报导，Vidu 模型融合 Diffusion 与 Transformer，开创性创建了 U-ViT，在 4 月宣布时反对一键生成长达 16 秒、分辨率高达 1080P 的高清视频实质。官方表示 Vidu 不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点。

{{userData.name}}已认证

国产文生视频大模型 Vidu 将迎革新：反对生成 32 秒实质、音视频合成

高考语文作文首次遇上 AI：2024 新课标 I 卷谈“AI 时代问题是否会越来越少”

华为与中山大学眼科中央发布 ChatZOC 眼科大模型，服务效率提升 75%

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！