《Python 机械进修》作者新作：从头开始构建庞大言语模型，代码已开源

AI
6月24日
编辑

机器之心

自 ChatGPT 发布以来，庞大言语模型（LLM）已经成为推动人工智能发展的关键技术。近期，机械进修和 AI 研究员、畅销书《Python 机械进修》作者 Sebastian Raschka 又写了一本旧书 ——《Build a Large Language Model (From Scratch)》，旨在讲授从头开始构建庞大言语模型的整个过程，包括如何创立、训练和调整庞大言语模型。最近，Sebastian Raschka 在 GitHub 上开源了这本旧书对应的代码库。项目地址： LLM 来说，指令微调能够有效

自 ChatGPT 发布以来，庞大言语模型（LLM）已经成为推动人工智能发展的关键技术。

近期，机械进修和 AI 研究员、畅销书《Python 机械进修》作者 Sebastian Raschka 又写了一本旧书 ——《Build a Large Language Model (From Scratch)》，旨在讲授从头开始构建庞大言语模型的整个过程，包括如何创立、训练和调整庞大言语模型。《Python 机械进修》作者新作：从头开始构建庞大言语模型，代码已开源

最近，Sebastian Raschka 在 GitHub 上开源了这本旧书对应的代码库。

《Python 机械进修》作者新作：从头开始构建庞大言语模型，代码已开源

项目地址：https://github.com/rasbt/LLMs-from-scratch/tree/main?tab=readme-ov-file

对 LLM 来说，指令微调能够有效提升模型性能，因此各种指令微调法子陆续被提出。Sebastian Raschka 发推重点介绍了项目中关于指令微调的部分，其中讲授了：

如何将数据格式化为 1100 指令 – 响应对；

如何运用 prompt-style 模板；

如何使用掩码。

《Python 机械进修》作者新作：从头开始构建庞大言语模型，代码已开源

《Build a Large Language Model (From Scratch)》用清晰的文字、图表和示例解释每个阶段，从最初的设计和创立，到采用通用语料库进行预训练，一直到针对特定任务进行微调。

《Python 机械进修》作者新作：从头开始构建庞大言语模型，代码已开源

具体来说，旧书和项目讲授了如何：

规划和编码 LLM 的所有部分；

准备适合 LLM 训练的数据集；

使用自己的数据微调 LLM；

运用指令调整法子来确保 LLM 遵循指令；

将预训练权重加载到 LLM 中。

作者介绍

《Python 机械进修》作者新作：从头开始构建庞大言语模型，代码已开源

个人主页：https://sebastianraschka.com/

Sebastian Raschka 是一名机械进修和人工智能研究员，曾在威斯康星大学麦迪逊分校担任统计学助理教授，专门研究深度进修和机械进修。他让关于 AI 和深度进修相关的内容更加容易获得，并教人们如何大规模利用这些技术。

此外，Sebastian 热衷于开源软件，十多年来一直是一个充满热情的开源贡献者。他提出的法子现已成功运用于 Kaggle 等机械进修竞赛。

除了编写代码，Sebastian 还喜欢写作，并撰写了畅销书《Python Machine Learning》（《Python 机械进修》）和《Machine Learning with PyTorch and ScikitLearn》。

参考链接：https://twitter.com/rasbt/status/1802327699937009807

给TA打赏

共{{data.count}}人

人已打赏

llm Raschka Sebastian 指令进修

英伟达将在中东五国数据中心布署 AI 技能，首次在当地大规模推出产品

2024-6-24 9:12:38

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场，私人专业版限时免费

2024-6-24 10:58:24

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

TOP1

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果
12月19日
TOP2

历时2年，华人团队力作，震撼开源生成式物理引擎Genesis，可模拟世界万物
12月19日
TOP3

细节表现超Sora，网友：真正的国产之光！MiniMax视频模型再上新
12月16日
2024年AI 编程现在可以做到什么程度？
12月18日
实测来了！Kimi发布k1视觉思考模型，实力颠覆K12教育赛道，涌现能力强得可怕，免费可用！网友：国产之光！
12月16日
超越所有SOTA！最新UniScene：视频点云Occ三大生成任务全部暴力提升~
12月12日
抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩
12月12日
腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践
12月11日

❯

个人中心

今日签到

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

我的优惠劵

_￥_优惠劵
使用时效：无法使用
使用时效：
之前
使用时效：永久有效

优惠劵ID：
×
限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]
所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×
删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部