“国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布,号称中文效果比 GPT-4o 更出色

西湖心辰昨日发布了心辰 Lingo 语音大模型,号称是“国内首个端到端通用语音大模型”。官方表示,针对心辰 Lingo 端到端语音大模型的能力,在多个领域和中文上进行增强,使得心辰 Lingo 的中文语音效果,相较 GPT-4o 更为出色。心辰 Lingo 于 8 月 24 日开启内测,至今已经有超千家企业用户预约测试。相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程。心辰 Ling

西湖心辰昨日发布了心辰 Lingo 语音大模型,号称是“国内首个端到端通用语音大模型”。

官方表示,针对心辰 Lingo 端到端语音大模型的能力,在多个领域和中文上进行增强,使得心辰 Lingo 的中文语音效果,相较 GPT-4o 更为出色。心辰 Lingo 于 8 月 24 日开启内测,至今已经有超千家企业用户预约测试。

“国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布,号称中文效果比 GPT-4o 更出色

相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程。

心辰 Lingo 语音模型技术能力上具备以下三个特点:

原生的语音理解:能够识别语音中的文字信息与其他重要特征,如情感、语气、音调等

多种语音风格表达:可以根据上下文和用户指令,自适应调整语音的速度、高低、噪声强度,并能够生成对话、歌唱、相声等多种风格的语音响应

语音模态超级压缩:采用具有数百倍压缩率的语音编解码器,降低计算和存储成本

AI在线注意到,目前心辰 Lingo 语音大模型仍需通过内测申请,申请链接如下:https://lingo.xinchenai.com/

相关资讯

“国内首个能力追齐 GPT-4o 语音能力的模型”,心辰 Lingo 语音 AI 模型开放内测预约

金科汤姆猫投资的西湖心辰于今年 8 月推出心辰 Lingo 语音大模型,是国内首个端到端语音大模型,已于今天(8 月 24 日)开启内测预约。在 8 月 21 日发布的公告中,官方介绍称相比较传统 TTS,端到端语音大模型则是一种更为全面的技术,它不仅可以语音识别,还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节,实现了从语音输入到语音反馈的完整交互过程,极大地丰富了人机交互的深度和广度。AI在线援引官方新闻稿,心辰 Lingo 语音模型是国内首个能力追齐 GPT-4o 语音能力的模型,技术能力上具备

国内首个端到端通用语音大模型——心辰Lingo开放内测预约

内容导览:国内首个端到端通用语音大模型——心辰Lingo现开放内测预约。 在技术上,心辰Lingo具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中文语音效果。9月5日西湖心辰将在外滩大会上正式发布该模型,这一技术的突破或将对多个领域产生深远影响,有望引领人机交互进入一个全新的时代。登陆「心辰Lingo」语音大模型官网(),即可马上预约内测。什么是端到端语音对话模型?传统的语音交互是先将语音转成文字,再理解文字,然后生成回复文字,最后再将文字转为语音。每次交互中“语音-文本”和“

消息称微软亚洲研究院前首席研究经理谭旭加入月之暗面,研发类 GPT-4o 端到端语音模型

感谢据“晚点 Auto”昨晚报道,微软亚洲研究院前首席研究经理谭旭于 8 月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。报道称,月之暗面的整个多模态研究早在去年 10 月就已开始。接近该公司人士称,目前正有 10 人左右的团队在研发视频模型,为确保产品更具差异性,对外发布计划仍在推迟。