“国内首个能力追齐 GPT-4o 语音能力的模型”，心辰 Lingo 语音 AI 模型开放内测预约

金科汤姆猫投资的西湖心辰于今年 8 月推出心辰 Lingo 语音大模型，是国内首个端到端语音大模型，已于今天（8 月 24 日）开启内测预约。在 8 月 21 日发布的公告中，官方介绍称相比较传统 TTS，端到端语音大模型则是一种更为全面的技术，它不仅可以语音识别，还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节，实现了从语音输入到语音反馈的完整交互过程，极大地丰富了人机交互的深度和广度。AI在线援引官方新闻稿，心辰 Lingo 语音模型是国内首个能力追齐 GPT-4o 语音能力的模型，技术能力上具备

金科汤姆猫投资的西湖心辰于今年 8 月推出心辰 Lingo 语音大模型，是国内首个端到端语音大模型，已于今天（8 月 24 日）开启内测预约。

在 8 月 21 日发布的公告中，官方介绍称相比较传统 TTS，端到端语音大模型则是一种更为全面的技术，它不仅可以语音识别，还集成了自然语言处理、意图识别、对话管理以及语音合成等多个环节，实现了从语音输入到语音反馈的完整交互过程，极大地丰富了人机交互的深度和广度。

AI在线援引官方新闻稿，心辰 Lingo 语音模型是国内首个能力追齐 GPT-4o 语音能力的模型，技术能力上具备以下三个显著特点：

原生的语音理解：作为端到端模型，心辰 Lingo 不仅能够识别语音中的文字信息，还能精确捕捉其他重要特征，如情感、语气、音调，甚至环境音，帮助模型更全面地理解语音内容，从而提供更加自然和生动的交互体验。

多种语音风格表达：心辰 Lingo 可以根据上下文和用户指令，自适应调整语音的速度、高低、噪声强度，并能够生成对话、歌唱、相声等多种风格的语音响应，有效提升了模型在不同应用场景下的灵活性和适应性。

语音模态超级压缩：心辰 Lingo 采用具有数百倍压缩率的语音编解码器，能够将语音压缩至极短的长度，在显著降低计算和存储成本的同时帮助模型生成高质量语音内容。

{{userData.name}}已认证

“国内首个能力追齐 GPT-4o 语音能力的模型”，心辰 Lingo 语音 AI 模型开放内测预约

集成 Photoshop 功能的强大节点！ComfyUI layer style节点保姆级教程（三）

腾讯推出“全球首个”语音指挥 FPS AI 队友，可据输入指令推测玩家意图

推理模型 DeepSeek-R1-Lite 预览版上线，号称媲美 OpenAI o1-preview

AI自动操作VS Code，自然语言搞定各种配置，来自阿里通义智能计算实验室 | 开源

九大成像模式一键解析，生物医学图像AI再迎突破！微软、UW等BiomedParse登Nature子刊

微软在东京开设其日本首个研发中心，专注于将机器人技术与 AI 相结合

钉钉AI重磅更新：深入业务场景，上线工单等场景AI助理

Red Hat 收购 Neural Magic 并开源其技术：优化通用设备 AI 性能，可媲美专用芯片

AI 助力脑瘤手术：10 秒内精准识别残留肿瘤

DeepL 推出首个语音翻译解决方案 DeepL Voice，号称消除虚拟会议中语言障碍