ElevenLabs
ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%
ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。 该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。 根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。
ElevenLabs向所有作家开放AI有声读物出版计划,与Audible竞争
据TechCrunch消息,语音AI公司ElevenLabs现已允许作者在其阅读器应用上发布AI生成的有声读物,此前该公司与Spotify合作推出AI叙述有声读物。 ElevenLabs上个月筹集1.8亿美元巨额资金,去年开始邀请作家试用出版计划,如今该计划正式向所有作家开放。 该公司旨在提供价格合理且易用的有声读物创作工具,以降低制作成本,与Audible竞争,因为Audible给作者的版税较低。
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
人工智能语音公司ElevenLabs再次引发关注,该公司刚刚完成了一轮高达2.5亿美元的C轮融资,估值在30亿至33亿美元之间。 本次融资由ICONIQ Growth领投,显示出市场对AI语音技术的强烈信心。 仅在一年之前,ElevenLabs刚刚完成了一笔8000万美元的B轮融资,当时的估值仅为现在的三分之一,可见该公司发展之迅猛。
普通话响应速度提升 3 倍,ElevenLabs 发布文本转语音 Turbo 2.5 AI 模型
ElevenLabs 昨日(7 月 19 日)发布博文,介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型,支持普通话等 32 种语言,为全球近 80% 的地区提供高质量、低延迟的 AI 对话。Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。AI在线附上宣传视频如下: Turbo v2.5 模型结合
一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具
ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 ElevenLabs 与素材平台 Shutterstock 合作,利用其庞大的音频素材库训练了生成式模型。据悉,Shutterstock 的内容
语音合成之王ElevenLabs搅局音乐界,新模型创作水准堪驰援《歌手》
机器之能报道编辑:Cardinal一个简单提示,二十几个词,就能生成一首三分时长的歌曲,其水准足以打榜。很多人制作视频时,喜欢强强联合——用 Suno、Udio 生成背景音乐,ElevenLabs 负责旁白。前者是逼真的 AI 音乐创作工具,ElevenLabs 则是目前最著名、最好的 AI 声音生成平台之一。但现在,格局要生变了。最近,ElevenLabs 又推出一款新型 AI 音乐生成器,进军音乐界。听闻音频之王也要「通吃」音乐之王,很多人的反应都在演我:ElevenLabs 在 X 上展示了新模型创作的一些曲
- 1