墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

让我们训练一个 Storyteller。今天外网又被 Andrej Karpathy 这一良心课程刷屏了!项目是 11 小时前被 Karpathy 上传到 Github 的,目的是要建立一个能够创作、提炼和阐释小故事的大谈话模型。如今已经被许多网友转发推荐。项目地址:,这是 karpathy 老师的新冒险。它将带您从谈话建模、机器进修的基础知识开始进修,然后到多模态、RLHF、模型布置。也有网友称:看起来 karpathy 正在做一门完整的、相似 cs231n 的课程, 《LLM101n》将讲授如何从头开始建立相似

让我们训练一个 Storyteller。

墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

今天外网又被 Andrej Karpathy 这一良心课程刷屏了!

项目是 11 小时前被 Karpathy 上传到 Github 的,目的是要建立一个能够创作、提炼和阐释小故事的大谈话模型。如今已经被许多网友转发推荐。

墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

项目地址:https://github.com/karpathy/LLM101n

有网友表示,这是 karpathy 老师的新冒险。它将带您从谈话建模、机器进修的基础知识开始进修,然后到多模态、RLHF、模型布置。

墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

也有网友称:看起来 karpathy 正在做一门完整的、相似 cs231n 的课程, 《LLM101n》将讲授如何从头开始建立相似 ChatGPT 的模型,非常雄心勃勃!

墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

以下是该课程的项目简介:

在本课程中,我们将建立一个 Storyteller AI 大型谈话模型 (LLM),旨在使用 AI 创建、完善和说明小故事,涵盖从基础到相似于 ChatGPT 的可运行 Web 应用程序,并使用 Python、C 和 CUDA 从头开始建立项目,并且只需要最少的计算机科学前提条件。这门课程将使学生对 AI、LLM 和深度进修有相对深入的了解。

教学大纲如下:

第 01 章 Bigram 谈话模型(谈话建模)

第 02 章 Micrograd(机器进修、反向传播)

第 03 章 N-gram 模型(多层感知器、matmul、gelu)

第 04 章 Attention(attention、softmax、位置编码器)

第 05 章 Transformer(transformer、residue、layernorm、GPT-2)

第 06 章 Tokenization(minBPE、字节对编码)

第 07 章 优化(初始化、优化、AdamW)

第 08 章 Deepspeed I:设备(设备,CPU,GPU,…)

第 09 章 DS II:精度(混合精度训练,fp16,bf16,fp8,……)

第 10 章 DS III:分布式(分布式优化、DDP、ZeRO)

第 11 章 数据集(数据集、数据加载、合成数据生成)

第 12 章 推理 I:kv-cache(kv-cache)

第 13 章 推理 II:量化(quantization)

第 14 章 微调 I:SFT(监督微调 SFT、PEFT、LoRA、聊天(chat))

第 15 章 微调 II:RL(强化进修,RLHF,PPO,DPO)

第 16 章 布置(API、Web 应用程序)

第 17 章 多模态(VQVAE、扩散 transformer)

那还等什么,学起来吧!

给TA打赏
共{{data.count}}人
人已打赏
AI

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场,私人专业版限时免费

2024-6-24 10:58:24

AI

LeCun学生、纽大助理老师Alfredo视频上新,跟他收费学本科AI课程

2024-6-24 11:20:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索