智谱 AI 发布视频生成工具“清影”：30 秒快速生成，免费开放体验

2024-07-26 12:50

感谢智谱 AI 今日宣布，对视频生成模型进行全新升级，并正式推出新一代产品 ——CogVideoX。CogVideoX 模型目前已在智谱清言的 PC 端、移动应用端以及小程序端正式上线。所有 C 端用户均可通过智谱清言的 AI 视频生成功能「清影」（Ying），免费体验 AI 文本生成视频和图像生成视频的服务。据介绍，CogVideoX 的核心技术特点如下：针对内容连贯性问题，智谱 AI 自主研发了一套高效的三维变分自编码器结构（3D VAE）。该结构能够将原始视频数据压缩至原始大小的 2%，降低了视频扩散生成模型

感谢智谱 AI 今日宣布，对视频生成模型进行全新升级，并正式推出新一代产品 ——CogVideoX。

CogVideoX 模型目前已在智谱清言的 PC 端、移动应用端以及小程序端正式上线。所有 C 端用户均可通过智谱清言的 AI 视频生成功能「清影」（Ying），免费体验 AI 文本生成视频和图像生成视频的服务。

据介绍，CogVideoX 的核心技术特点如下：

针对内容连贯性问题，智谱 AI 自主研发了一套高效的三维变分自编码器结构（3D VAE）。该结构能够将原始视频数据压缩至原始大小的 2%，降低了视频扩散生成模型的训练成本和难度。结合 3D RoPE 位置编码模块，该技术提升了在时间维度上对帧间关系的捕捉能力，从而建立了视频中的长期依赖关系。

在可控性方面，智谱 AI 打造了一款端到端的视频理解模型，该模型能够为大量视频数据生成描述。这一创新增强了模型对文本的理解和对指令的遵循能力，确保生成的视频更加符合用户的输入需求，并能够处理超长且复杂的 prompt 指令。

模型采纳了一种将文本、时间、空间三维一体融合的 transformer 架构。该架构摒弃了传统的 cross attention 模块，设计了 Expert Block 以实现文本与视频两种不同模态空间的对齐，并通过 Full Attention 机制优化模态间的交互效果。

「清影」的主要特点如下：

快速生成：仅需 30 秒即可完成 6 秒视频的生成。

高效的指令遵循能力：即使是复杂的 prompt，清影也能准确理解并执行。

内容连贯性：生成的视频能够较好地还原物理世界中的运动过程。

画面调度灵活性：例如，镜头能够流畅地跟随画面中的三只狗狗移动。

此外，智谱大模型开放平台 bigmodel.cn 也部署了「清影」。企业和开发者可通过 API 调用式，体验并使用「清影」的文本生成视频和图像生成视频功能。

AI在线附智谱官网链接：https://chatglm.cn/video

在海外，Sora 正在被可灵替代

从没想过中国第一个让国外网友求着开放会员订阅通道的AI应用居然是出自快手。在经历一个多月的狂奔吸引上百万人排队内测之后快手可灵终于全面开放，最有意思的是直到开放测试之前还有网友表示自己没排进去内测。狗BEE 提示词：长着小狗身体的蜜蜂在花丛中飞而在内测过程中，中外网友则经历了身份互换，外网用户也体验了一把之前国内网友求手机号注册chatgpt的辛酸。

7/30/2024 6:36:00 PM

林杰鑫

智谱清影与AI角色创作平台“捏Ta”开展多模态合作推动IP一致性落地

2月19日，北京智谱华章科技有限公司宣布，其旗下的多模态创作平台“清影”与AI角色创作平台“捏Ta”达成战略合作，共同探索AI角色设计到动画创作的完整路径，并推动IP一致性的技术落地。此次合作旨在深入挖掘二次元用户需求与AI应用场景，为用户提供更高质量的生成效果和更快的推理速度。 “清影”基于智谱最新升级的视频生成大模型CogVideoX-2，在模型结构、训练方法和数据工程上进行了全面更新，图生视频基础模型能力大幅提升38%。

2/20/2025 8:55:00 AM

AI在线

智谱 AI CEO 张鹏谈文生视频：当前可用来做影视辅助工作，若要改变电影制作仍需距离

据新浪科技报道，智谱 CEO 张鹏今日接受采访，谈到了基于生成式 AI 的文生视频技术对影视行业的冲击等话题。他表示，从 OpenAI 的 Sora 出现之后，有关话题就一直在讨论。在国外，这件事已经引起很大影响，包括好莱坞罢工等。张鹏透露，自己有一次在北京电影学院与教师一同讨论此事，众人得出了一致的看法：从技术发展角度来看，大家都认为 AI 的发展“是很好的事情”，也是“很重要的方向”，对影视行业的变化有积极意义。张鹏表示，从目前来看，“至少也觉得如果把这项技术用在直接面向最终观众的生产过程当中，可能还是不太够。

7/26/2024 10:28:00 PM

清源

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

智谱 AI 发布视频生成工具“清影”：30 秒快速生成，免费开放体验

相关资讯

在海外，Sora 正在被可灵替代

智谱清影与AI角色创作平台“捏Ta”开展多模态合作 推动IP一致性落地

智谱 AI CEO 张鹏谈文生视频：当前可用来做影视辅助工作，若要改变电影制作仍需距离

智谱清影与AI角色创作平台“捏Ta”开展多模态合作推动IP一致性落地