阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”

作者：浩渺

2024-12-14 05:44

Step-1o 支持语音、文本等混合形式的输入和输出，可以快速反应并随时打断，它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。

感谢阶跃星辰昨日在公众号宣布推出 Step-1o 千亿参数端到端语音大模型，据称是“国内首个千亿参数端到端语音大模型”。

据阶跃星辰介绍，传统的语音模型采用级联方案，用户输入的语音信息需要先转化为文本，再二次转化成语音输出，这个过程不仅会降低传输效率、更会在过程中折损掉包括情绪在内的信息，导致语音模型时延长反应慢、回答质量和智能水平不足、情感表达空洞刻板的缺陷。但端到端的语音方案，可以实现语音理解和生成的一体化，提升模型智商和情商的上限。

AI在线从官方介绍获悉，Step-1o 支持语音、文本等混合形式的输入和输出，可以快速反应并随时打断，它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征；

Step-1o 能够通过自学和模仿不断提升回复质量，既能提供解决问题的专业建议，也能作为提供高情绪价值的陪伴。此外，Step-1o 还传承了阶跃星辰语言大模型的创作能力。

阶跃星辰透露，近期，Step-1o 将接入跃问 App 端，为用户提供实时语音通话服务。

相关标签：

人工智能大模型阶跃星辰

相关资讯

阶跃星辰开放平台迎来多项更新，上线 Step-1X 图像生成大模型

阶跃星辰开放平台迎来多项更新，上线 Step-1X 图像生成大模型

近日，大模型创业公司阶跃星辰在其开放平台体验中心，正式上线了图像生成大模型 Step-1X，注册即可体验。（指路链接：）事实上，这款大模型之前已经备受期待。在 7 月份举行的 2024 世界人工智能大会上，阶跃星辰一口气发布了万亿参数语言大模型 Step-2、多模态大模型 Step-1.5V 和图像生成大模型 Step-1X 三款大模型，并且跟上海电影梦幻联动，基于经典 IP《大闹天宫》开发了 H5 互动体验“测测你是哪路神仙”。

基座大模型「六进二」：南阶跃，北智谱

基座大模型「六进二」：南阶跃，北智谱

作者丨陈彩娴今天消息，阶跃星辰完成了 B 轮融资，总融资金额达数亿美元。 AI 科技评论获悉，此次融资有国资、战略和财务投资人等多家参与，核心投资方包括上海国有资本投资有限公司及其旗下基金，战略和财务投资人包括腾讯投资、五源资本、启明创投等。据了解，这笔融资将用于继续投入基础模型研发，强化多模态和复杂推理能力，并通过产品和生态加大覆盖 C 端应用场景，提供丰富的用户体验。

告别微软，姜大昕带领这支精英团队攀登Scaling Law，万亿参数模型已有预览版

告别微软，姜大昕带领这支精英团队攀登Scaling Law，万亿参数模型已有预览版

攀登 Scaling Law，打造万亿参数大模型，前微软 NLP 大牛姜大昕披露创业路线图。前段时间，OpenAI 科学家 Jason Wei 的一份作息时间表引发了广泛关注。表中有很多让人看了会心一笑的梗，比如「9 点 45：背诵 OpenAI 章程，向最优化的神祷告，学习《苦涩的教训》」「10 点用 Google Meet 开会，讨论怎么在更多数据上训练更大的模型」「11 点写代码，用来在更多数据上训练更大的模型」「1 点：实操，在更多数据上训练更大的模型」「4 点：对用更多数据训练的更大的模型进行提示工程」…

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动 SK 海力士宣布参展 CES 2025，将展示 122TB 企业级固态硬盘等产品突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架阿里云与黑芝麻智能完成大模型车载芯片级适配类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手 AI模拟细胞，走向全新虚拟生命，斯坦福团队呼吁是时候走出全新的一步了

标签云