语音识别

SoundHound AI（SOUN）获得重要 AIOps 认可，但股价目标被下调

最近，SoundHound AI， Inc.（NASDAQ:SOUN）在人工智能领域获得了显著认可，特别是在 AIOps(人工智能运维)方面的表现。然而，尽管在技术上取得了一定的成就，市场对其未来的预期却出现了下调。这一消息引发了投资者的广泛关注。

4/17/2025 11:01:19 AM

AI在线

英语印度口音太重不用愁：初创公司 Krisp 推出 AI 转换，一键变为地道美式

Krisp 表示，该功能不会改变说话者的声音，仅调整音素以匹配美式发音。目前，该功能已在企业环境中测试，Beta 版已上线 Krisp 桌面应用，用户可在通话前或通话中随时启用。

3/27/2025 3:23:34 PM

清源

阿里通义实验室语音团队负责人鄢志杰离职

据tech星球消息，阿里通义实验室语音团队负责人鄢志杰已于 2 月 15 日正式离职，其职级为阿里原P序列体系中的P10 级别。鄢志杰是智能语音领域专家， 2003 年进入中科大语音实验室攻读博士，师从科大讯飞创始人王仁华教授。 2008 年获博士学位后，他在微软亚洲研究院语音组担任主管研究员至 2015 年，主要研究语音识别、语音合成等领域。

3/14/2025 3:00:41 PM

AI在线

小红书开源的语音识别模型FireRedASR，中文识别准确率优越

在语音识别领域，中文识别的技术发展一直备受关注。近日，小红书的 FireRed 团队发布了一个全新的开源语音识别模型 ——FireRedASR。这个基于大模型的语音识别系统在多个标准测试集上取得了优异的成绩，标志着中文语音识别技术的一次重大突破。

2/12/2025 9:14:00 AM

AI在线

小红书语音识别新突破！开源FireRedASR，中文效果新SOTA

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

2/9/2025 2:35:00 PM

机器之心

ICLR 2025｜小米新一代Kaldi语音识别算法CR-CTC，纯CTC性能实现SOTA

2/7/2025 1:38:00 PM

机器之心

面向语音控制前端应用程序的自然语言处理（NLP）：架构、进展与未来方向

译者 | 李睿审校 | 重楼由于智能设备、虚拟助手和免提界面的日益普及，语音控制前端应用程序获得了更多的关注。自然语言处理（NLP）是这些系统的核心，能够实现类似人类的理解和语音生成。本白皮书介绍了语音控制前端应用程序的NLP方法的深入研究，阐述了语音识别、自然语言理解和生成技术的最新技术，以及它们在现代Web前端中的架构集成。

1/14/2025 9:47:44 AM

李睿

资讯热榜

Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求 Ollama 支持全线的 Qwen 3 模型即梦3.0海外版发布，电影级视觉与精准英文排版引领AI创作新高度纳米AI发布MCP万能工具箱，简化AI工具集成与调用 Qwen3正式发布，优化编码与代理能力，强化MCP支持引领AI新潮流 AI视频资讯早读！7个产品更新+8个案例精选 DeepWiki：AI驱动的GitHub代码库百科全书正式亮相 OpenAI发布gpt-image-1 API，4o图像生成能力正式开放

标签云

人工智能 OpenAI AIGC AI ChatGPT AI绘画 DeepSeek 数据模型机器人谷歌大模型 Midjourney 智能开源用户学习 GPT 微软 Meta 图像 AI创作技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质芯片代码生成式英伟达腾讯神经网络研究计算 Anthropic 3D Sora AI for Science AI设计机器学习开发者 GPU AI视频华为场景预测人形机器人百度苹果伟达 Transformer 深度学习 xAI 模态字节跳动 Claude 大语言模型搜索具身智能驾驶神器推荐文本 Copilot LLaMA 算力安全视觉视频生成干货合集训练应用大型语言模型科技亚马逊智能体 DeepMind 特斯拉