英语印度口音太重不用愁:初创公司 Krisp 推出 AI 转换,一键变为地道美式

Krisp 表示,该功能不会改变说话者的声音,仅调整音素以匹配美式发音。目前,该功能已在企业环境中测试,Beta 版已上线 Krisp 桌面应用,用户可在通话前或通话中随时启用。

据外媒 TechCurnch 报道,音频初创公司 Krisp 周三推出一项 AI 口音转换功能,用户可在通话时改变自己的口音。首个版本支持将印度英语口音转换为美式英语

Krisp 表示,该功能不会改变说话者的声音,仅调整音素以匹配美式发音。目前,该功能已在企业环境中测试,Beta 版已上线 Krisp 桌面应用,用户可在通话前或通话中随时启用。

英语印度口音太重不用愁:初创公司 Krisp 推出 AI 转换,一键变为地道美式

公司联合创始人阿尔托・米纳相表示,这项功能源于他个人的交流经历。“尽管我的英语很流利,但很多人仍然听不懂我的口音。我们认为,改变口音或许能帮助人们更顺畅地沟通。两年前我们开始研究这个问题,如今终于推出 Beta 版。”

不过该媒体的测试发现,转换后的声音不够自然,甚至偶尔会漏掉单词。Krisp 解释称,目前仍处于 Beta 阶段,模型将在后续更新中优化。

Krisp 称,在企业测试中,该功能让销售转化率提升 26.1%,每本书的收入增长 14.8%。

公司选择先支持印度口音,原因是印度人在全球 STEM 领域(AI在线注:科学 Science、技术 Technology、工程 Engineering 和数学 Mathematics)的工作者中占比很高。未来还计划增加更多口音选项,包括菲律宾口音

Krisp 表示,该模型基于数千份语音样本训练,涵盖不同口音和方言,并在获得用户同意后使用了其会议助手的数据。米纳相补充道,该功能的另一大优势是无需提前采集用户语音数据,而是能实时创建个人语音模型。

相关资讯

小红书语音识别新突破!开源FireRedASR,中文效果新SOTA

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

小红书开源的语音识别模型FireRedASR,中文识别准确率优越

在语音识别领域,中文识别的技术发展一直备受关注。 近日,小红书的 FireRed 团队发布了一个全新的开源语音识别模型 ——FireRedASR。 这个基于大模型的语音识别系统在多个标准测试集上取得了优异的成绩,标志着中文语音识别技术的一次重大突破。

阿里通义实验室语音团队负责人鄢志杰离职

据tech星球消息,阿里通义实验室语音团队负责人鄢志杰已于 2 月 15 日正式离职,其职级为阿里原P序列体系中的P10 级别。 鄢志杰是智能语音领域专家, 2003 年进入中科大语音实验室攻读博士,师从科大讯飞创始人王仁华教授。 2008 年获博士学位后,他在微软亚洲研究院语音组担任主管研究员至 2015 年,主要研究语音识别、语音合成等领域。