效果最佳！阶跃星辰开源Step-Video-T2V 视频生成模型

2025-02-18 08:55

今日，阶跃星辰与吉利汽车集团宣布，联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。其中，阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量，能够直接生成204帧、540P分辨率的高质量视频，确保生成内容信息密度高、一致性强。

今日，阶跃星辰与吉利汽车集团宣布，联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。

其中，阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。该模型拥有300亿参数量，能够直接生成204帧、540P分辨率的高质量视频，确保生成内容信息密度高、一致性强。评测结果显示，Step-Video-T2V在指令遵循、运动平滑性、物理合理性、美感度等方面均表现出色，显著超越市面上既有的最佳开源视频模型。

微信截图_20250218085337.png

目前，这两款模型均已在跃问App内上线，供开发者朋友们体验并提供宝贵建议。

阶跃Step-Video-T2V视频生成模型在复杂运动、美感人物、视觉想象力等方面展现出卓越的生成能力。它能够精准理解指令，高效助力视频创作者实现创意呈现。无论是高雅优美的芭蕾舞、对抗激烈的空手道，还是紧张刺激的羽毛球、高速翻转的跳水，Step-Video-T2V都能生成真实且符合物理规律的画面。

同时，它还支持多种镜头运动方式和景别切换，能够生成大幅度运镜的视觉效果。生成的人物形象则更加逼真、生动，细节丰富，表情自然。

GitHub:

https://github.com/stepfun-ai/Step-Audio

Hugging Face:

https://huggingface.co/collections/stepfun-ai/step-audio-67b33accf45735bb21131b0b

技术报告:

https://github.com/stepfun-ai/Step-Audio/blob/main/assets/Step-Audio.pdf

告别微软，姜大昕带领这支精英团队攀登Scaling Law，万亿参数模型已有预览版

攀登 Scaling Law，打造万亿参数大模型，前微软 NLP 大牛姜大昕披露创业路线图。前段时间，OpenAI 科学家 Jason Wei 的一份作息时间表引发了广泛关注。表中有很多让人看了会心一笑的梗，比如「9 点 45：背诵 OpenAI 章程，向最优化的神祷告，学习《苦涩的教训》」「10 点用 Google Meet 开会，讨论怎么在更多数据上训练更大的模型」「11 点写代码，用来在更多数据上训练更大的模型」「1 点：实操，在更多数据上训练更大的模型」「4 点：对用更多数据训练的更大的模型进行提示工程」…

4/1/2024 3:05:00 PM

机器之心

揭秘：阶跃星辰万亿MoE+多模态大模型矩阵亮相

在 2024 年世界人工智能大会的现场，很多人在一个展台前排队，只为让 AI 大模型给自己在天庭「安排」一个差事。具体流程是这样的：首先， AI 会管你要一张个人照片，并参考《大闹天宫》画风生成你在仙界的形象照。接下来，它会引导你进入一个交互式的剧情选择和交谈环节（其实是 AI 大模型自己编的剧情），然后根据你的选择和回答评估出你的 MBTI 人格类型，并根据这个类型为你在天庭「安排」一个差事。当然，除了现场排队，你还可以在线体验（扫描下方二维码即可）。这是大模型创业公司阶跃星辰与上影合作的 AI 互动体验《AI

7/4/2024 6:29:00 PM

机器之心