阶跃星辰
阶跃星辰 Step-Video-TI2V 图生视频模型开源:运动幅度和镜头运动可控
今年 2 月阶跃星辰开源了两款 Step 系列多模态大模型 ——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,今天阶跃星辰继续开源图生视频模型 ——Step-Video-TI2V,一款基于 30B 参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。
3/20/2025 3:19:58 PM
远洋
百万成本揭秘LLM训练黄金法则,阶跃星辰推出全领域适用的超参数优化工具
在人工智能的激烈竞争中,一场耗资百万美元的大规模实验正悄然改变着大语言模型的训练方式。 阶跃星辰研究团队日前发布重磅研究成果,他们通过耗费近100万NVIDIA H800GPU小时的算力,从零开始训练了3,700个不同规模的模型,累计训练了惊人的100万亿个token,揭示出一条被称为"Step Law"的普适性缩放规律,为大语言模型的高效训练提供了全新指南。 这项研究不仅仅是对超参数优化的探索,更是第一个全面考察模型最优超参在不同形状、稀疏度和数据分布下稳定性的工作。
3/13/2025 3:41:00 PM
AI在线
智元机器人与阶跃星辰战略合作,共探具身智能与大模型融合
3月12日,智元机器人与阶跃星辰签署战略合作协议,探索具身智能与多模态大模型融合。将聚焦新零售等场景,推进数据标准与评测体系搭建等。智元有三大机器人家族,阶跃星辰已发布大模型矩阵。#智元机器人 #阶跃星辰 #战略合作
3/13/2025 3:17:21 PM
浩渺
华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型,上线魔乐社区
今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。 开发者和企业用户在魔乐社区中可以直接下载并体验。 Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。
3/10/2025 3:10:00 PM
新闻助手
华为昇腾适配阶跃星辰多模态开源模型
据科创板日报报道,今日魔乐社区(Modelers)上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。
3/10/2025 2:47:58 PM
远洋
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025 年 2 月 21 日,阶跃在上海迎来了首届 Step UP 生态开放日。 活动中,阶跃重点介绍了其在智能终端 Agent 领域的战略布局,同时汇聚了吉利汽车集团、OPPO、智元机器人等行业巨头,共同见证了大模型技术在智能终端 Agent、金融财经、内容创作、新零售和数字人等领域的强大赋能与创新实践。 此外,阶跃星辰还发布了「繁星计划」二期,旨在从模型优化、算力支持、资本投入、数据共享和企业孵化等方面为开发者提供全方位赋能,激发更多 Agent 应用创新。
2/25/2025 4:00:00 PM
郑佳美
阶跃星辰举办首届生态开放日,智能终端 Agent 成为焦点
日前,阶跃星辰在上海成功举办了首届 Step UP 生态开放日。 此次活动汇聚了来自各行各业的重量级合作伙伴,共同展示了基于大模型技术的丰富应用场景和创新体验。 阶跃星辰 CEO 姜大昕在开幕致辞中强调,智能终端 Agent 是大模型技术落地的重要突破点,未来将重点布局汽车、手机、具身智能和 IoT 等核心应用场景。
2/24/2025 11:51:00 AM
AI在线
接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型
两款 Step 系列开源多模态大模型,性能位列开源多模态全行业第一。 本周二,国内 AI 创业公司阶跃星辰和吉利汽车集团宣布联合开源两款多模态大模型。 这两款大模型分别是视频生成模型 Step-Video-T2V 和行业内首款产品级开源语音交互模型 Step-Audio。
2/18/2025 12:45:00 PM
机器之心
阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
今日阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃 Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃 Step-Audio。
2/18/2025 10:14:49 AM
远洋
效果最佳!阶跃星辰开源Step-Video-T2V 视频生成模型
今日,阶跃星辰与吉利汽车集团宣布,联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。 其中,阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。 该模型拥有300亿参数量,能够直接生成204帧、540P分辨率的高质量视频,确保生成内容信息密度高、一致性强。
2/18/2025 8:55:00 AM
AI在线
阶跃星辰再拿多模态榜首,全方位升级发布六款模型
作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。
1/22/2025 5:02:00 PM
朱可轩
大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”
阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。
1/21/2025 3:14:48 PM
浩渺
阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview
阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。
1/17/2025 4:55:14 PM
沛霖(实习)
刚刚,阶跃星辰发布Step R-mini!推理模型从此不再文理偏科
这是阶跃星辰 Step 系列模型家族的首个推理模型。 类似 OpenAI o1 的推理模型在国内终于卷起来了。 刚刚,国产大模型「六小虎」成员阶跃星辰发布了最新一代模型 ——Step Reasoner mini(简称「Step R-mini」)。
1/16/2025 9:18:00 PM
机器之心
阶跃星辰发布 Step-1X-Medium 模型:AI 图片生成提速 30%、支持图生图垫图玩法、升级中国风创作
“阶跃星辰”官方公众号昨日(12 月 25 日)发布博文,宣布推出 Step-1X-Medium 增强 AI 模型,显著提升生成速度、理解能力、细节质感以及创作功能,目标成为创作者的得力助手。
12/26/2024 8:32:23 AM
故渊
基座大模型「六进二」:南阶跃,北智谱
作者丨陈彩娴今天消息,阶跃星辰完成了 B 轮融资,总融资金额达数亿美元。 AI 科技评论获悉,此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。 据了解,这笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖 C 端应用场景,提供丰富的用户体验。
12/25/2024 2:38:00 PM
陈彩娴
消息称大模型独角兽阶跃星辰已完成 B 轮融资,总额“数亿美元”
此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。
12/23/2024 2:53:54 PM
清源
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
12/14/2024 5:44:41 PM
浩渺
资讯热榜
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
上海AI实验室开源InternVL3系列多模态大型语言模型
50组多风格提示词,全面测评Midjourney V7生图效果!
全日程揭晓!ICLR 2025论文分享会我们北京见
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持
击败DeepSeek-R1!豆包新推理模型仅用前者参数量1/3!还将开源两个基准,瞄准通用推理能力!
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
神经网络
腾讯
计算
研究
Sora
AI for Science
3D
AI设计
Anthropic
机器学习
GPU
开发者
场景
华为
预测
伟达
Transformer
百度
深度学习
苹果
模态
AI视频
驾驶
文本
xAI
搜索
人形机器人
大语言模型
Copilot
神器推荐
LLaMA
字节跳动
具身智能
Claude
算力
安全
应用
视频生成
科技
视觉
亚马逊
干货合集
2024
AGI
特斯拉
DeepMind
训练