支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

2024-11-03 09:37

中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。时隔不到半年，TeleAI 星辰语音大模型的多方言能力再次升级，攻克了湛江话、宜宾话、洛阳话、烟台话等方言，将方言种类从 30 种提升至 40 种，并引入对英文的识别。与传统的有标注训练方法相比，TeleAI 通过预训练语音识别模型，利用海量无标注数据进行预训练，再通过少量有标注数据进行微调。

中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。

时隔不到半年，TeleAI 星辰语音大模型的多方言能力再次升级，攻克了湛江话、宜宾话、洛阳话、烟台话等方言，将方言种类从 30 种提升至 40 种，并引入对英文的识别。

与传统的有标注训练方法相比，TeleAI 通过预训练语音识别模型，利用海量无标注数据进行预训练，再通过少量有标注数据进行微调。

由于方言语音数据普遍存在无标注数据多而有标注数据少的特点，这种“预训练 + 微调”的模型方案与方言场景的需求能够高度契合。

支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

TeleAI 还在模型结构和成本优化上进行了创新，实现对人工标注数据的需求量大幅降低约 50 倍，且保障模型效果与有监督训练的方言模型水平相当。

AI在线附 GitHub 开源地址：https://github.com/Tele-AI/TeleSpeech-ASR

支持 30 种方言混说，中国电信 AI 研究院发布“星辰”超多方言语音识别大模型

中国电信人工智能研究院（TeleAI）日前宣布发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。据介绍，该模型可打破单一模型只能识别特定单一方言的困境，支持同时识别理解粤语、上海话、四川话、温州话等 30 多种方言，是国内支持最多方言的语音识别大模型。应用场景方面，该模型有望极大解决老年人、老少边穷地区用户信息服务无法触达的问题。该大模型研发团队首创“蒸馏膨胀”联合训练算法，解决超大规模多场景数据集和大规模参数条件下，预训练坍缩的问题，实现 1B 参数 80 层模型稳定

5/25/2024 3:47:03 PM

清源

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

近日，中国电信人工智能研究院（TeleAI）“复杂推理大模型” TeleAI-t1-preview 正式发布，即将上线天翼 AI 开放平台。 TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。早在 1500 多年前，数学家祖冲之就曾在《辩戴法兴难新历》中指出，复杂事物的运行规律并非超自然现象，而是可以通过实际观测、数据推理而严谨求得。

1/26/2025 9:41:00 AM

新闻助手

换了30多种方言，我们竟然没能考倒中国电信的语音大模型

不管你来自哪个城市，相信在你的记忆中，都有自己的「家乡话」：吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒……某种意义上说，方言不只是一种语言习惯，也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中，有不少就是来自各地方言。当然，有些时候，方言也是一种交流「壁垒」。在现实生活中，我们经常会看到方言导致的「鸡同鸭讲」，比如这个：如果你关注最近科技圈的动态就会知道，当前的 AI 语音助手已经能达到「实时回复」的水准，甚至比人类反应还快。而且，AI 已经能够充分理解人类的情感，自己也能表现出

5/27/2024 4:05:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ Haisnap横空出世，小白用户也能轻松打造AI应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 本地部署DeepSeek+DiFy平台构建智能体应用韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

支持中英双语及 40 种方言任意混说，中国电信 TeleAI 星辰语音大模型升级

相关资讯

支持 30 种方言混说，中国电信 AI 研究院发布“星辰”超多方言语音识别大模型

TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

换了30多种方言，我们竟然没能考倒中国电信的语音大模型