ICLR 2024 | 为音视频结合提供新视角,清华大学胡晓林团队推出RTFS-Net
视听语音结合(AVSS)技术旨在通过面部信息从混合旌旗灯号中结合出目标措辞者的声音。这项技术能够应用于智能助手、远程会议和增强现实等应用,改进在嘈杂环境中语音旌旗灯号质量。传统的视听语音结合格式依赖于复杂的模型和大量的盘算资源,尤其是在嘈杂背景或多措辞者场景下,其本能往往受到限制。为了突破这些限制,基于深度学习的格式开始被研究和应用。然而,现有的深度学习格式面临着高盘算复杂度和难以泛化到未知环境的…- 52
- 0
RTFS-Net
❯
个人中心
今日签到
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
- ¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!