​ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。 该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。 根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。

QQ_1740621264139.png

根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。该公司表示,Scribe 支持99种语言的高精度转录,其中包括在以前被忽视的语言,如塞尔维亚语、粤语和马拉雅拉姆语。

ElevenLabs 的首席研究员 Flavio Schneider 在社交平台 X 上表示,Scribe 是公司迄今发布的 “最聪明的音频理解模型”。他强调,Scribe 不仅仅是转录工具,还能理解音频内容,能够检测非语言事件(如笑声、音效、音乐和背景噪音),并在复杂环境下分析长时间的音频内容进行准确的说话者区分。值得一提的是,Scribe 能够在同一个音频文件中识别并隔离多达32位不同的说话者。

QQ_1740621326377.png

ElevenLabs 提醒用户,Scribe“最适合需要高精度转录的场合,而非实时转录”。该公司还计划推出低延迟版本,以扩大其在实时应用中的使用。

根据 FLEURS 和 Common Voice 的基准结果,Scribe 在处理现实世界音频挑战方面表现出色,尤其在意大利语(准确率98.7%)和英语(准确率96.7%)的单词错误率方面达到了最低。

Scribe 现已通过 ElevenLabs 官网和 API 提供使用,定价为每小时输入音频0.40美元,未来六周还将享受50% 的折扣。此外,针对实时应用的低延迟版本也在开发中。

对于企业决策者而言,Scribe 为高精度转录提供了一种可扩展的工具,适用于需要自动化文档、会议转录和内容可及性的行业。该模型对多种语言的高精度处理也将惠及跨国公司、媒体公司和客户支持应用。

值得注意的是,Scribe 的发布与竞争对手 Hume 的文本转语音模型 Octave 的发布同日进行。Octave 是一种基于大型语言模型的文本转语音工具,用户可以根据情感需求自定义 AI 生成的声音,旨在用于内容创作,如有声书、播客和视频游戏配音。尽管 Scribe 和 Octave 的功能不同,但二者的发布反映了 AI 驱动音频模型日益激烈的竞争。

产品入口:https://elevenlabs.io/blog/meet-scribe

划重点:  

🌟 Scribe v1是 ElevenLabs 最新推出的语音转文本模型,准确率在多语言中创下新高。  

🗣️ 支持99种语言,能够区分多达32位不同的说话者,适应复杂音频环境。  

💰 当前定价为每小时0.40美元,未来六周享受50% 折扣,低延迟版本正在开发中。

相关资讯

OpenAI 语音转写工具 Whisper 被曝存在重大缺陷:会凭空生成大段虚假内容

当地时间 27 日,据美联社报道,超过十位软件工程师、开发人员和学术研究人员称,OpenAI 的语音转写工具 Whisper 存在一个重大缺陷:有时会凭空生成大段甚至整句虚假内容。 这些专家指出,这些生成的文本(AI在线注:业内通常称为“AI 幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。 专家们认为,这一问题尤其令人担忧,因为 Whisper 已被广泛应用于全球多个行业,包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。

本地或服务器端运行均可,Proton 推出 AI 电子邮件写作助手

Proton 当地时间昨日推出了 AI 电子邮件写作助手 Proton Scribe。该辅助软件内置于 Proton Mail 邮箱之中,可节省邮件编写时间,提升企业团队生产力。▲ 校对与缩短功能界面展示Proton Scribe 支持根据用户需求从零生成邮件初稿,也可用于校对、缩短或正式化现有文本草稿。▲ 初稿生成功能展示Proton 表示 Proton Scribe 助手专为保护数据隐私而设计,既可同其它类似软件一样在专用服务器端运行,又可在用户硬件上运行。后一方式可保证用户数据不离开本地,更适合处理敏感数据或

晚上就应该睡觉?新的机器学习技术探索昼夜节律

编辑 | 雪松昼夜节律,如睡眠-觉醒周期,是大多数生物与生俱来的,对地球上的生命至关重要。昼夜时钟在 24 小时日夜周期中协调生物的各项生理变化,会间接影响我们人类的体能水平、健康程度、生存能力。同样,将新陈代谢与日出落日同步等情况也存在于植物中,准确的生物钟有助于调节开花。了解昼夜节律,于植物而言,有助于提高植物的生长和产量;于人类而言,则有可能揭示出治疗疾病的新途径。IBM欧洲研究所与厄尔汉姆研究所的合作团队,描述了一系列基于人工智能(AI)和机器学习(ML)的方法。这些方法可以进行更具成本效益的分析并深入了解