闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

为了重拾自己对 AI 开源和教育的热情,Andrej Karpathy 在家录了一个详解反向传播的课程。

前段时间,特斯拉 AI 高级总监、自动驾驶 Autopilot 负责人 Andrej Karpathy 在推特上宣布自己即将离职,并表示从今年三月份开始,自己已休假四个月。

在休假的这段时间,Karpathy 也没有闲着,自己在家录了个课程。视频内容长达 2 小时 25 分钟,基于 micrograd 详细介绍了神经网络和反向传播。

对于这门课程,Karpathy 自信地表示:「这是 8 年来领域内对神经网络和反向传播的最佳讲解。」

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

视频地址:https://twitter.com/karpathy/status/1559672719414681601

Karpathy 还在个人推特上打起了赌:只要你懂 Python,并能模糊记起高中学过的求导知识,看了这个视频你还不理解反向传播和神经网络核心要点的话,那我就吃一只鞋。

言外之意这门课程只需观看者掌握基本的 Python 编程技能和高中微积分的简单知识,非常适合零基础的同学在线学习。

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

有网友调侃到虽然自己很想看 Karpathy 直播吃鞋,但他相信 Karpathy 的视频课程不会让人失望的。

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

课程内容

接近 2 个半小时的视频按照时间段划分了近 20 个小部分,主要包括以下内容。

micrograd 项目概述。2020 年 4 月,Karpathy 开源了其编写的微型 autograd 引擎 micrograd,其中用 100 行代码实现了针对动态构建的 DAG 的反向传播算法,并用 50 行代码实现了类 PyTorch API 的库。目前,micrograd 项目的 GitHub Star 量已达 2.2k。

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

项目地址:https://github.com/karpathy/micrograd/

然后 Karpathy 介绍了只有一个输入的简单函数的导数和具有多个输入的简单函数的导数、启动 micrograd 的核心 Value 对象及其可视化的方法,并举了两个手动反向传播的例子。

接下来 Karpathy 系统地介绍了:

为单个操作实现反向传播;

为整个表达式图实现反向函数;

修复一个节点多次出现的反向传播 bug;

使用更多操作替换 tanh 激活函数;

用 PyTorch 实现上述操作,并与 micrograd 进行比较;

用 micrograd 构建一个神经网络库 (MLP);

创建一个微型数据集,编写损失函数;

收集神经网络的所有参数;

手动做梯度下降优化,训练网络。

最后 Karpathy 总结了反向传播与现代神经网络的关系。此外,Karpathy 还在视频中探究了 PyTorch 中 tanh 激活函数的反向传播机制。

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

Andrej Karpathy 

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

个人主页:https://karpathy.ai/

2005-2009 年,Andrej Karpathy 本科就读于加拿大多伦多大学,主修计算机科学与物理,辅修数学。在这里,他第一次接触到深度学习,聆听 Hinton 的课程。

2009 -2011 年,Karpathy 硕士就读于加拿大不列颠哥伦比亚大学,其导师为计算机科学系教授 Michiel van de Panne,主要研究物理模拟中用于敏捷机器人的机器学习。

2011-2016 年,Karpathy 博士就读于斯坦福大学,师从著名 AI 学者李飞飞,专注于研究卷积 / 循环神经网络以及它们在计算机视觉、自然语言处理和交叉领域的应用。期间,他设计并担任斯坦福首个深度学习课程《CS231n:卷积神经网络与视觉识别》的主要讲师。

与此同时,Karpathy 还有三段实习经历。2011 年,他进入发展初期的谷歌大脑实习,致力于视频领域的大规模无监督学习。之后的 2013 年,他再次在谷歌研究院实习,从事 YouTube 视频的大规模监督学习。2015 年,他在 DeepMind 实习,参与深度强化学习团队的工作。

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

Karpathy 是 OpenAI 的创始成员和研究科学家。仅一年多后,2017 年,Karpathy 接受马斯克的邀请加入特斯拉,接替了当时的特斯拉 Autopilot 负责人、苹果 Swift 语言、LLVM 编译器之父 Chris Lattner。

五年里,Karpathy 一手促成了 Autopilot 的开发。随着特斯拉从最开始的自动驾驶慢慢扩展到更广泛的人工智能领域,Karpathy 也被提为特斯拉的 AI 高级总监,直接向马斯克汇报工作。

现在根据领英上的资料显示,Karpathy 已于 7 月离开特斯拉。

闲下来的Andrej Karpathy录了个课程:保证学会,你听不懂我吃鞋

至于离开特斯拉,接下来要做什么,此前 Karpathy 透漏还没有具体的安排,但希望重拾自己长久以来对 AI 技术工作、开源和教育等方面的热情。

相关资讯

光学算法简化模拟人工智能训练

编辑 | 白菜叶研究人员开发了一系列模拟和其他非常规机器学习系统,期望它们将证明比今天的计算机更节能。但是训练这些人工智能来完成它们的任务一直是一个很大的绊脚石。NTT 设备技术实验室和东京大学的研究人员现在表示,他们已经提出了一种训练算法(NTT 上个月宣布),该算法对让这些系统实现其承诺大有帮助。他们的结果建立在光学模拟计算机上,代表了在获得研究人员长期以来从「非常规」计算机架构中寻求的潜在效率增益方面取得的进展。现代人工智能程序使用一种名为人工神经网络的受生物学启发的架构来执行图像识别或文本生成等任务。控制计

特斯拉分享第二代 Optimus 机器人工作视频:可将电池精确插入托盘

感谢特斯拉今日再次分享了一段第二代 Optimus 人形机器人的工作视频,视频显示,该机器人可将电池单体精确地插入托盘中。据特斯拉官方介绍,他们训练并部署了一个神经网络,允许 Optimus 开始执行有用的任务,例如从传送带上捡起电池单体并精确地将它们插入托盘中。这个神经网络完全端到端运行,意味着它只使用来自机器人的 2D 摄像头以及板载的本体感知传感器的视频,并直接产生关节控制序列。 特斯拉还称,已经在其中一家工厂部署了几个机器人,它们正在实际的工作站上每天进行测试并不断改进。此外,新款 Optimus 现在也能

速揽2500星,Andrej Karpathy重写了一份minGPT库

时隔两年,GPT的Pytorch训练库minGPT迎来更新!