Bridge-TTS
击败扩散模型,清华朱军团队基于薛定谔桥的新语音合成系统来了
近日,由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统 [1],凭借其 「数据到数据」的生成范式,在样本质量和采样速度两方面,均击败了扩散模型的 「噪声到数据」范式。论文链接:: 代码实现: 2021 年起,扩散模型(diffusion models)开始成为文本到语音合成(text-to-speech, TTS)领域的核心生成方法之一,如华为诺亚方舟实验室提出的 Grad-TTS [2]、浙江大学提出的 DiffSinger [3] 等方法均实现了较高的生成质量。此后,又有众多研究工作有效提升了扩
12/25/2023 11:54:00 AM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
机器人
谷歌
大模型
Midjourney
模型
智能
用户
学习
GPT
开源
微软
AI创作
图像
Meta
技术
论文
Stable Diffusion
马斯克
算法
生成式
蛋白质
Gemini
芯片
代码
神经网络
腾讯
计算
研究
Sora
AI设计
英伟达
3D
AI for Science
GPU
开发者
机器学习
场景
预测
华为
Anthropic
伟达
Transformer
模态
百度
深度学习
AI视频
驾驶
文本
苹果
搜索
神器推荐
LLaMA
算力
xAI
Copilot
人形机器人
安全
科技
视频生成
应用
字节跳动
具身智能
干货合集
2024
视觉
大语言模型
AGI
特斯拉
Claude
亚马逊
语音
AI应用场景