运动可控！阶跃星辰 Step-Video-TI2V 图生视频模型开源

2025-03-20 02:32

上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成，能够生成102帧、5秒、540P分辨率的视频，具有运动幅度可控和镜头运动可控两大核心特点，尤其在动漫效果方面表现出色。与现有的开源图生视频模型相比，Step-Video-TI2V不仅在参数规模上提供了更高的上限，其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性，为创作者提供了更灵活的选择。

微信截图_20250320143140.png

Step-Video-TI2V的开发过程中，团队进行了两大关键优化。首先，引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同，该模型采用了更直接的方式，将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接，从而确保生成的视频与输入图片高度一致。其次，通过AdaLN模块引入视频动态性打分信息，使用户在生成视频时可以指定不同的运动级别，精准控制视频的动态幅度，从而平衡动态性、稳定性和一致性。此外，团队还对主体动作和镜头运动进行了专项精准标注，进一步提升了模型在主体动态性和运镜效果上的表现。

Step-Video-TI2V的核心特点包括运动幅度可控、多种运镜控制、动漫效果优异以及支持多尺寸生成。用户可以根据创作需求自由切换动态与稳定画面，生成从基本的推拉摇移、升降到复杂电影级运镜效果的视频。该模型在动漫类任务上的表现尤为突出，非常适合动画创作和短视频制作等应用场景。同时，它支持多种尺寸的图生视频，无论是横屏、竖屏还是方屏，都能满足不同平台的需求。

体验地址:

https://yuewen.cn/videos

GitHub:

https://github.com/stepfun-ai/Step-Video-TI2V

Github-ComfyUI:

https://github.com/stepfun-ai/ComfyUI-StepVideo

阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

4/9/2025 9:01:18 AM

AI在线

微软官方亲自出教程，拿捏「Prompt工程」高级玩法

几个月来，ChatGPT、GPT-4 等大模型陆续发布。这些模型表现出了强大的涌现能力，但模型生成的结果是随机的，时好时坏，部分原因与 Prompt 的设计密切相关。

5/11/2023 2:14:00 PM

机器之心

告别微软，姜大昕带领这支精英团队攀登Scaling Law，万亿参数模型已有预览版

攀登 Scaling Law，打造万亿参数大模型，前微软 NLP 大牛姜大昕披露创业路线图。前段时间，OpenAI 科学家 Jason Wei 的一份作息时间表引发了广泛关注。表中有很多让人看了会心一笑的梗，比如「9 点 45：背诵 OpenAI 章程，向最优化的神祷告，学习《苦涩的教训》」「10 点用 Google Meet 开会，讨论怎么在更多数据上训练更大的模型」「11 点写代码，用来在更多数据上训练更大的模型」「1 点：实操，在更多数据上训练更大的模型」「4 点：对用更多数据训练的更大的模型进行提示工程」…

4/1/2024 3:05:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用 OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

运动可控！阶跃星辰 Step-Video-TI2V 图生视频模型开源

相关资讯

阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

微软官方亲自出教程，拿捏「Prompt工程」高级玩法

告别微软，姜大昕带领这支精英团队攀登Scaling Law，万亿参数模型已有预览版