语音识别
英语印度口音太重不用愁:初创公司 Krisp 推出 AI 转换,一键变为地道美式
Krisp 表示,该功能不会改变说话者的声音,仅调整音素以匹配美式发音。目前,该功能已在企业环境中测试,Beta 版已上线 Krisp 桌面应用,用户可在通话前或通话中随时启用。
阿里通义实验室语音团队负责人鄢志杰离职
据tech星球消息,阿里通义实验室语音团队负责人鄢志杰已于 2 月 15 日正式离职,其职级为阿里原P序列体系中的P10 级别。 鄢志杰是智能语音领域专家, 2003 年进入中科大语音实验室攻读博士,师从科大讯飞创始人王仁华教授。 2008 年获博士学位后,他在微软亚洲研究院语音组担任主管研究员至 2015 年,主要研究语音识别、语音合成等领域。
小红书开源的语音识别模型FireRedASR,中文识别准确率优越
在语音识别领域,中文识别的技术发展一直备受关注。 近日,小红书的 FireRed 团队发布了一个全新的开源语音识别模型 ——FireRedASR。 这个基于大模型的语音识别系统在多个标准测试集上取得了优异的成绩,标志着中文语音识别技术的一次重大突破。
小红书语音识别新突破!开源FireRedASR,中文效果新SOTA
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
面向语音控制前端应用程序的自然语言处理(NLP):架构、进展与未来方向
译者 | 李睿审校 | 重楼由于智能设备、虚拟助手和免提界面的日益普及,语音控制前端应用程序获得了更多的关注。 自然语言处理(NLP)是这些系统的核心,能够实现类似人类的理解和语音生成。 本白皮书介绍了语音控制前端应用程序的NLP方法的深入研究,阐述了语音识别、自然语言理解和生成技术的最新技术,以及它们在现代Web前端中的架构集成。
- 1