普通话响应速度提升 3 倍,ElevenLabs 发布文本转语音 Turbo 2.5 AI 模型

ElevenLabs 昨日(7 月 19 日)发布博文,介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型,支持普通话等 32 种语言,为全球近 80% 的地区提供高质量、低延迟的 AI 对话。Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。AI在线附上宣传视频如下: Turbo v2.5 模型结合

ElevenLabs 昨日(7 月 19 日)发布博文,介绍推出了全新的 Turbo v2.5 文本到语音 AI 模型,支持普通话等 32 种语言,为全球近 80% 的地区提供高质量、低延迟的 AI 对话。

Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。

本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。AI在线附上宣传视频如下:

Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构,用户基本上不需要等待,就能提供高质量的 AI 生成音频输出。

Turbo 模型实现了快速语音合成,同时保持流畅和自然的高品质音质,响应时间不超过 400 毫秒。

ElevenLabs 成立于 2022 年,总部位于伦敦,专注于开发人工智能语音模型和工具,可以创建不同语言、口音和情感的合成语音。

公司首席执行官 Mati Staniszewski 表示,ElevenLabs 目前拥有约 40 名远程办公员工,分布在全球各地,并计划到年底将团队扩大至 100 人。

ElevenLabs 非常重视人工智能内容的透明度,并开发了 AI Speech Classifier 等工具帮助识别合成音频,同时也在开发用于电影配音的工具,并正在开发一个允许用户生成 AI 语音并通过授权赚钱的平台。

相关资讯

OpenAI官方下场修复GPT-4变懒,上新多个模型、还大降价

今天,OpenAI 一口气宣布了 5 个新模型,包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。不知大家是否还记得,去年年底 GPT-4 开始变「懒」的事实。比如在高峰时段使用 GPT-4 或 ChatGPT API 时,响应会变得非常缓慢且敷衍,有时它会拒绝回答用户提出的问题,甚至还会单方面中断对话。 这种情况对于码农来说,更是深有体会,有人抱怨道「让 ChatGPT 扩展一些代码,它竟然让我自己去写。」原本想借助 ChatGPT 帮助自己编写代码,现在好

语音合成之王ElevenLabs搅局音乐界,新模型创作水准堪驰援《歌手》

机器之能报道编辑:Cardinal一个简单提示,二十几个词,就能生成一首三分时长的歌曲,其水准足以打榜。很多人制作视频时,喜欢强强联合——用 Suno、Udio 生成背景音乐,ElevenLabs 负责旁白。前者是逼真的 AI 音乐创作工具,ElevenLabs 则是目前最著名、最好的 AI 声音生成平台之一。但现在,格局要生变了。最近,ElevenLabs 又推出一款新型 AI 音乐生成器,进军音乐界。听闻音频之王也要「通吃」音乐之王,很多人的反应都在演我:ElevenLabs 在 X 上展示了新模型创作的一些曲

一句话搞定爆炸音效,ElevenLabs 推出新 AI 工具

ElevenLabs 此前已推出利用人工智能生成人类声音和音乐的工具,现在他们更进一步,推出了可以为播客、电影或游戏创作音效的工具。ElevenLabs 的名为“Sound Effects”的新工具可以根据用户提供的文本描述生成最长 22 秒的音效,并与公司原有的语音和音乐平台结合使用。用户每次使用“Sound Effects”后,可以获得至少四个可下载的音频片段供选择。 ElevenLabs 与素材平台 Shutterstock 合作,利用其庞大的音频素材库训练了生成式模型。据悉,Shutterstock 的内容