阶跃星辰
百万成本揭秘LLM训练黄金法则,阶跃星辰推出全领域适用的超参数优化工具
在人工智能的激烈竞争中,一场耗资百万美元的大规模实验正悄然改变着大语言模型的训练方式。 阶跃星辰研究团队日前发布重磅研究成果,他们通过耗费近100万NVIDIA H800GPU小时的算力,从零开始训练了3,700个不同规模的模型,累计训练了惊人的100万亿个token,揭示出一条被称为"Step Law"的普适性缩放规律,为大语言模型的高效训练提供了全新指南。 这项研究不仅仅是对超参数优化的探索,更是第一个全面考察模型最优超参在不同形状、稀疏度和数据分布下稳定性的工作。
智元机器人与阶跃星辰战略合作,共探具身智能与大模型融合
3月12日,智元机器人与阶跃星辰签署战略合作协议,探索具身智能与多模态大模型融合。将聚焦新零售等场景,推进数据标准与评测体系搭建等。智元有三大机器人家族,阶跃星辰已发布大模型矩阵。#智元机器人 #阶跃星辰 #战略合作
华为昇腾适配阶跃星辰Step-Video和Step-Audio开源大模型,上线魔乐社区
今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。 开发者和企业用户在魔乐社区中可以直接下载并体验。 Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。
华为昇腾适配阶跃星辰多模态开源模型
据科创板日报报道,今日魔乐社区(Modelers)上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025 年 2 月 21 日,阶跃在上海迎来了首届 Step UP 生态开放日。 活动中,阶跃重点介绍了其在智能终端 Agent 领域的战略布局,同时汇聚了吉利汽车集团、OPPO、智元机器人等行业巨头,共同见证了大模型技术在智能终端 Agent、金融财经、内容创作、新零售和数字人等领域的强大赋能与创新实践。 此外,阶跃星辰还发布了「繁星计划」二期,旨在从模型优化、算力支持、资本投入、数据共享和企业孵化等方面为开发者提供全方位赋能,激发更多 Agent 应用创新。
阶跃星辰举办首届生态开放日,智能终端 Agent 成为焦点
日前,阶跃星辰在上海成功举办了首届 Step UP 生态开放日。 此次活动汇聚了来自各行各业的重量级合作伙伴,共同展示了基于大模型技术的丰富应用场景和创新体验。 阶跃星辰 CEO 姜大昕在开幕致辞中强调,智能终端 Agent 是大模型技术落地的重要突破点,未来将重点布局汽车、手机、具身智能和 IoT 等核心应用场景。
接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型
两款 Step 系列开源多模态大模型,性能位列开源多模态全行业第一。 本周二,国内 AI 创业公司阶跃星辰和吉利汽车集团宣布联合开源两款多模态大模型。 这两款大模型分别是视频生成模型 Step-Video-T2V 和行业内首款产品级开源语音交互模型 Step-Audio。
阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
今日阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃 Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃 Step-Audio。
效果最佳!阶跃星辰开源Step-Video-T2V 视频生成模型
今日,阶跃星辰与吉利汽车集团宣布,联合开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。 其中,阶跃Step-Video-T2V视频生成模型在参数量和性能上均处于全球领先水平。 该模型拥有300亿参数量,能够直接生成204帧、540P分辨率的高质量视频,确保生成内容信息密度高、一致性强。
阶跃星辰再拿多模态榜首,全方位升级发布六款模型
作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。
大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”
阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。
阶跃星辰推理模型 Step R-mini 上线:宣称“文理兼修”,AIME 等数学基准测试成绩超 o1-preview
阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。
刚刚,阶跃星辰发布Step R-mini!推理模型从此不再文理偏科
这是阶跃星辰 Step 系列模型家族的首个推理模型。 类似 OpenAI o1 的推理模型在国内终于卷起来了。 刚刚,国产大模型「六小虎」成员阶跃星辰发布了最新一代模型 ——Step Reasoner mini(简称「Step R-mini」)。
阶跃星辰发布 Step-1X-Medium 模型:AI 图片生成提速 30%、支持图生图垫图玩法、升级中国风创作
“阶跃星辰”官方公众号昨日(12 月 25 日)发布博文,宣布推出 Step-1X-Medium 增强 AI 模型,显著提升生成速度、理解能力、细节质感以及创作功能,目标成为创作者的得力助手。
基座大模型「六进二」:南阶跃,北智谱
作者丨陈彩娴今天消息,阶跃星辰完成了 B 轮融资,总融资金额达数亿美元。 AI 科技评论获悉,此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。 据了解,这笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖 C 端应用场景,提供丰富的用户体验。
消息称大模型独角兽阶跃星辰已完成 B 轮融资,总额“数亿美元”
此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。
阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”
Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一
在大模型技术圈里,有一个获得不少认同的说法:阶跃星辰的底层基础模型能力很强,甚至是几家大模型公司中数一数二的。 但其实,拥有这种看法的大多是足够了解国内大模型能力现状的人,对于圈子之外的人,无法直观感受到这种潜移默化的底层硬实力。 然而,在被誉为「世界上第一个不可玩弄的 LLM 基准测试」的 LiveBench 榜单中,阶跃星辰给了行业一次强有力的冲击。