对任意一个范畴的进修,如果有人可以指点你完毕从基本概念、理论方法到零碎认知的构建,你的职业发展将事半功倍。
声纹鉴别范畴,现在就有这样一门课程刚刚上线。
什么是声纹鉴别?
声纹鉴别(Speaker Recognition)是一门位于音频信号处理、生物信息学以及 AI 等范畴交汇点的交叉学科。声纹鉴别手艺既是声纹手艺中最为核心的一项,也是生物特征鉴别手艺的一种,该手艺利用算法和神经网络模型,让机器从人们的语音信号中鉴别出说话人的身份信息。而随着 2014 年以来深度进修(DL)手艺的发展,声纹鉴别手艺进入全新阶段。
如何在深度进修时代零碎深入的进修声纹鉴别手艺与不断更新自己的学问储备,对范畴的初学者提出了全新的要求。谷歌声纹鉴别与语种鉴别团队负责人王泉博士的最新课程《声纹鉴别:从理论到编程实战》可以带你完毕学问体系的构建。
必要的课前准备
课程视频总时长超过 12 小时,并配有大量课后操练,包括课后考试、编程操练与大作业。所以首先希望人人可以规划好进修时间,安排一段较紧凑的进修计划完毕课程进修。
其次,这门课是手艺性很强的专业课程,对标大学本科高年级研讨课与研究生课程,并非科普视频,所以在进修过程中需要随时停下查阅资料、推导公式与消化思考,也欢迎人人在课程中提问。
最后,进修课程需要较根源的大学数学学问与一定的Python编程根源,因为课程采用「中文授课、英文课件」,所以还需要一点英文根源。
谁适合进修?
学生与科研人员:熟悉范畴全貌,为毕业论文与科研方向提供参考。
企业从业人员:完善学问与理论体系,了解学术界的前沿进展,保持职场竞争力。
任何对声纹范畴充满兴趣与热情的人:建立声纹范畴包括学术与产业界的零碎认识,扩展学问面,辅助相关决策。
课程讲授哪些内容?
课程将从声学、感知根源学问以及音频、信号处理等开始介绍,深入了解声纹的本质。所以,即使是没有任何语音方面根源和背景的同学,也可以轻松上手这门课程。
课程会涵盖从上世纪 60 年代一直到 2022 年出现的所有主流声纹鉴别手艺,让人人既可以对整个声纹手艺的发展史有一个全面的认知,又能熟悉学术界和工业界最前沿、最先进的手艺,保持自己的学问储备领先于其他从业人员。
同时,本课程将着重介绍基于深度进修的声纹鉴别零碎,包括卷积神经网络、循环神经网络、注意力机制、Transformer 等常用于声纹鉴别的神经网络结构,并对主流的深度进修声纹鉴别零碎进行归纳总结,横向对比各种推理方法和损失函数之间的优劣,帮助人人了解所有零碎的底层设计思路。
此外,课程还将讲解数据清洗、数据增强和数据融合等数据处理相关手艺。
课程大纲如下:
课后答疑与操练
课后操练分为三个部分,均配有参考答案,提交后可见:
课后考试:以单选题为主,考察对基本概念的了解。
编程操练:要求按照给定的函数接口实现相关功能,每道题目均会给出参考实现与测试案例。
课后作业:以问答题为主,并配有指点视频,手把手教人人使用常用工具与代码库。
课程最后将迎来最终挑战:结合课程中所学的全部内容,利用 Python 及 PyTorch 从零开始搭建一个完整的声纹鉴别零碎。其中,课程会提供详细的指点,帮助人人将项目分解为诸多低难度的子任务来分别完毕,并在 GitHub 上提供范例零碎以及代码解读视频,确保顺利完毕最终挑战。
课后答疑:课程配有「课后交流圈子」,人人有疑问可以留言,讲师将不定期录制答疑视频。
讲师介绍
课程购置
课程上线首周优惠价299元,2022年8月23日后恢复原价;
课程长期有效,购置后可反复观看进修,PC观看体验更佳;
课程配有交流群,购课后添加小助手即可入群;
扫码购置课程。
特别福利
最先购置课程的 5 位同学将获得赠书一本:由王泉老师所著的《声纹手艺:从核心算法到工程理论》。