语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

机器之能报道编辑：Cardinal一个简单提醒，二十几个词，就能生成一首三分时长的歌曲，其水准足以打榜。很多人制作视频时，喜欢强强联合——用 Suno、Udio 生成背景音乐，ElevenLabs 负责旁白。前者是逼真的 AI 音乐创作对象，ElevenLabs 则是目前最著名、最好的 AI 声响生成平台之一。但现在，格局要生变了。最近，ElevenLabs 又推出一款新型 AI 音乐生成器，进军音乐界。听闻音频之王也要「通吃」音乐之王，很多人的反应都在演我：ElevenLabs 在 X 上展示了新模型创作的一些曲

机器之能报道

编辑：Cardinal

一个简单提醒，二十几个词，就能生成一首三分时长的歌曲，其水准足以打榜。

很多人制作视频时，喜欢强强联合——用 Suno、Udio 生成背景音乐，ElevenLabs 负责旁白。前者是逼真的 AI 音乐创作对象，ElevenLabs 则是目前最著名、最好的 AI 声响生成平台之一。

但现在，格局要生变了。

最近，ElevenLabs 又推出一款新型 AI 音乐生成器，进军音乐界。听闻音频之王也要「通吃」音乐之王，很多人的反应都在演我：

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

ElevenLabs 在 X 上展示了新模型创作的一些曲目—— 只需 20 几个单词提醒就能将你的想法转化为一首歌，「所有歌曲都是从单个文本提醒生成的，无需编辑。」

这些官方发布的示例作品至少有 2 分钟时长，有的接近 3 分钟，歌手声响听起来很自然，歌曲风格包括爵士乐、流行音乐、回响贝斯（ dubstep ）和乡村音乐等，歌词也是系统生成。

音乐模型目前处于早期预览阶段，只有 ElevenLabs 工作人员可以访问。如果示例中的时长（比如三分钟）就是新模型默认的生成长度，这将会是一个巨大进步——这比 Udio 的 30 秒或 Suno 的 1 分钟要长得多，也意味着一个简单提醒就能生成一首完整歌曲，不再需要后续扩展。

这是六首由新音乐模型创作的歌曲：

1、歌名：It Started to Sing ( Jazz Version ) （ 2 分 59 秒）

提醒：A jazz pop top charts song with emotional vocals, catchy chorus, and trumpet solos

提醒：这是一首登上流行音乐榜单榜首的爵士流行乐，歌手歌唱动人，副歌朗朗上口，还有醒目的小号独奏。

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

视频链接：https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

2、歌名：Broke my Heart （ 2 分 50 秒）

提醒: Smooth Contemporary R&B with subtle Electronic elements, featuring a pulsing 104 BPM drum machine beat, filtered synths, lush electric piano, and soaring strings, with an intimate mood.

提醒：这是一段具有当代 R&B 风格的歌曲，节拍平稳流畅同时又巧妙地融入了一些电子元素。音乐以 104 BPM 的鼓点为基础，鼓点有力而富有律动感。歌曲中使用了滤波分解器营造氛围，电子钢琴旋律优美动听，弦乐恢弘大气，整体氛围温馨亲密。

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

视频链接：https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

3、歌名: My Love （ 3 分 01 秒）

提醒：Indie Rock with 90s influences, featuring a combination of clean and distorted guitars, driving drum beats, and a prominent bassline, with a moderate tempo around 120 BPM, and a mix of introspective and uplifting moods, evoking a sense of nostalgia and hope。

提醒：这是一首融合了独立摇滚和 90 年代风格的歌曲，音乐中清音吉他和失真吉他相互交织，鼓点强劲有力，推动着歌曲的节拍，同时低音贝斯也非常突出。歌曲节拍适中，约在 120 BPM 左右。整首歌的情绪时而沉思内省，时而振奋人心，唤起了一种怀旧和充满希望的感觉。

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

视频链接：https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

网友听完后的感叹

4、这是员工分享的一个作品，歌名：never stopping to learn。

一句非常简单的提醒：rap about never stopping to learn（这是一段有关学无止境的说唱），就生成了这首 3 分 10 秒长的歌曲。

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

视频链接：https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

ElevenLabs 员工还放出了另外两首作品，一个是说唱，一个是回响贝斯（ Dubstep ）曲风。不过，时长都只有 1 分多钟。

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

视频链接：https://mp.weixin.qq.com/s/__rEa2Ohu9SLFdqs6UschQ

英国音乐制作人 Beardyman 转发了上面这首 dubstep ，称「三年内几乎不可能以商业音乐为生。」

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

AI 音乐是今年迄今为止增长最快的分解内容领域之一，第一首 Suno 歌曲的收听量突破了一百万次，Udio 也推出了非常逼真的 AI 音乐创作对象。著名的科技媒体 tomsguide 评价认为，这些迄今为止共享的样本表明，ElevenLabs 新模型的创作质量在多种歌曲流派上都超过了另一个炙手可热的音乐生成器 Udio 。

比 suno、udio 要好得多，有网友表示：

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

「这是我听过的最令人印象深刻的 AI 生成的音乐：其他 AI 音乐生成对象听起来相当机器人和人工。这感觉就像是一个真正的飞跃。」

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

更便宜、更富有表现力的声响，这就是我们想要的。

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

ElevenLabs 以其自然的分解声响和令人印象深刻的准确语音克隆而闻名，进军音乐生成之前，他们也在布局 AI 音效——允许用户通过相对简单的提醒创建一些复杂、多层次声响效果。例如动物叫声、噼啪作响的篝火声、海浪、雷暴、风铃伴随老式的火车汽笛声。接下来涉足音乐对象，似乎也在逻辑之中：

声响正成为生成 AI 的一个快速增长领域，因为它为视觉创作提供了纯文本无法企及的新的体验维度，而克隆、分解语音只是声响的一部分，连同音乐对象、声效甚至自定义噪音一起就能比较完整地为创作者、观众，提供一种全新、也更身临其境的叙事和体验方式。

参考链接

Here’s an early preview of ElevenLabs Music.
All of the songs in this thread were generated from a single text prompt with no edits.
Title: It Started to Sing
Style: “Pop pop-rock, country, top charts song.” pic.twitter.com/Ge9tz3I4iR
— ElevenLabs (@elevenlabsio) May 9, 2024

{{userData.name}}已认证

语音分解之王ElevenLabs搅局音乐界，新模型创作水准堪驰援《歌手》

多模态AI是医学的未来，谷歌推出三个新模型，Med-Gemini迎来大升级

AI绘画保姆级教程！如何用 ComfyUI 快速生成黏土风？

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新

ChatGPT遇到这些人名开始自闭，OpenAI回应了

平安人寿ChatBI：大模型智能化报表的深度实践

字节跳动豆包 AI 文生图“喜提新技能”：App 可生成带有指定文字的图片

超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~

OpenAI 从谷歌 DeepMind 挖角三名高级工程师，专注于多模态 AI 研发

实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践