小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

作者：故渊

2024-08-17 07:21

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。图源：英伟达Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。英伟达通过从模型中删除 16 层来

英伟达公司联合 Meta 公司发布了最新的 Llama-3.1-Minitron 4B AI 模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

图源：英伟达

Llama-3.1-Minitron 4B 模型在 Llama-3.1-Minitron 8B 基础上蒸馏而来，英伟达在深度和宽度方向上使用了结构化剪枝技术。

AI在线注：剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。

英伟达通过从模型中删除 16 层来进行深度剪枝，并将其从 8B 模型缩减为 4B 模型，此外还部署另一种技术，通过修剪嵌入维度和 MLP 中间层来进行宽度剪枝。

除了剪枝，Nvidia 还采用了经典蒸馏技术来提高 Llama-3.1-Minitron 4B 的效率。

知识蒸馏是一个过程，在这个过程中，一个较小的模型（即学生）会被训练成模仿一个更大、更复杂的模型（即教师）的行为。通过这种方式，较小模型中保留了原始模型的大部分预测能力，但速度更快，资源更节省。

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

英伟达将此与蒸馏技术和剪枝技术相结合，确保重新训练的 4B 模型性能优异，并在更大的模型中得到很好的应用。

相关标签：

模型伟达 LLaMA 剪枝 4B

相关资讯

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强

小模型崛起了。上个月，Meta 发布了 Llama 3.1 系列模型，其中包括 Meta 迄今为止最大的 405B 模型，以及两个较小的模型，参数量分别为 700 亿和 80 亿。Llama 3.1 被认为是引领了开源新时代。然而，新一代的模型虽然性能强大，但部署时仍需要大量计算资源。因此，业界出现了另一种趋势，即开发小型语言模型 (SLM)，这种模型在许多语言任务中表现足够出色，部署起来也非常便宜。最近，英伟达研究表明，结构化权重剪枝与知识蒸馏相结合，可以从初始较大的模型中逐步获得较小的语言模型。

生成式AI时代的模型压缩与加速，韩松主讲MIT课程，资料全公开

生成式AI时代的模型压缩与加速，韩松主讲MIT课程，资料全公开

近年来，生成式大模型（如大语言模型、扩散模型）已显示出卓越的性能，但它们需要大量的计算资源。为了让这些模型更易于使用，提高它们的效率至关重要。在最新的一季 MIT 6.5940 课程中，MIT 学者韩松将深入解读生成式大模型时代的「AI 计算的模型压缩与加速技术」。课程主页：《TinyML 和高效的深度学习计算》。概括来说，这门课程将介绍高效的人工智能计算技术，以便在资源有限的设备上实现强大的深度学习应用。课程主题包括模型压缩、剪枝、量化、神经架构搜索、分布式训练、数据 / 模型并行化、梯度压缩和设备微调，还介绍了

“端侧 ChatGPT 时刻到来”，面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

“端侧 ChatGPT 时刻到来”，面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型

面壁智能官方公众号昨日（9 月 5 日）发布博文，宣布推出开源 MiniCPM3-4B AI 模型，声称“端侧 ChatGPT 时刻到来”。AI在线附上 MiniCPM 3.0 开源地址：是 MiniCPM 系列的第三代产品，整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125，媲美多款 70 亿~90 亿参数的 AI 模型。相比 MiniCPM1.0 / MiniCPM2.0，MiniCPM3-4B 拥有更强大、更多用途的技能集，可用于更广泛的用途。MiniCPM

资讯热榜

罗永浩 Jarvis 初创项目“J1 Assistant AI 助理”上线，利用语音与大模型互动突破非视距条件依赖！大规模区域、低成本的UWB-LiDAR标定与单次定位框架类 Mac Mini 大小的个人 AI 超算：英伟达 Project Digits 发布，起价 3000 美元斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手从DeepSeek-V3发布谈大模型的技术突破与未来机遇 3 到 5 秒即可同声传译 40 余种语言，时空壶推出 W4 Pro 实时翻译耳机全网都在扒的DeepSeek团队，是清北应届生撑起一片天 OpenAI发布新年目标，Agent智能体或将迎来百模大战

标签云