PyTorch

使用PyTorch和Hugging Face构建一个自动语音识别系统

译者 | 布加迪审校 | 重楼从语音助手到转录服务，自动语音识别（ASR）是许多应用中的一项关键技术。我们在本教程中旨在使用Hugging Face的预训练模型构建一条能够将语音转录为文本的ASR管道。我们将使用轻量级数据集来提高效率，并使用Wav2Vec2这种强大的语音识别自监督模型。

4/1/2025 9:31:34 AM

布加迪

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。

3/20/2025 11:22:12 AM

Rafał Siwek

PyTorch领军人物Horace He从Meta离职加入OpenAI前CTO创立的初创公司

近日，PyTorch 的核心开发者 Horace He 宣布从 Meta 离职，加入了由 OpenAI 前 CTO Mira Murati 创办的初创公司 Thinking Machines。 Horace He 在 Meta 工作了四年，在此期间，他为 PyTorch 贡献了大量心血。离职的消息不仅震惊了业界，也引发了对于 AI 未来发展的热议。

3/5/2025 2:19:00 PM

AI在线

PyTorch 灵魂人物 Horace He 从 Meta 出走，选择 OpenAI 前 CTO 初创公司

PyTorch 机器学习大神 Horace He 宣布，正是离职加入 OpenAI 前 CTO 初创 Thinking Machines。这位技术奇才，曾被 OpenAI、SSI、谷歌等顶级 AI 实验室争相邀请，最终选择了刚刚成立的初创。他的选择，不仅是个人职业生涯的转折，更是对 AI 未来发展方向的一次战略性押注。

3/5/2025 1:06:11 PM

汪淼

PyTorch内存优化的十种策略总结：在有限资源环境下高效训练模型

在大规模深度学习模型训练过程中，GPU内存容量往往成为制约因素，尤其是在训练大型语言模型(LLM)和视觉Transformer等现代架构时。由于大多数研究者和开发者无法使用配备海量GPU内存的高端计算集群，因此掌握有效的内存优化技术变得尤为关键。本文将系统性地介绍多种内存优化策略，这些技术组合应用可使模型训练的内存消耗降低近20倍，同时不会损害模型性能和预测准确率。

3/3/2025 10:42:50 AM

佚名

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

日本人工智能初创公司Sakana AI宣布推出“AI CUDA工程师”（AI CUDA Engineer），这一创新性的AI智能体系统旨在自动化生产高度优化的CUDA内核，显著提升机器学习操作的运行效率。根据X平台上的最新消息，该系统通过进化的大型语言模型(LLM)驱动代码优化技术，将常见PyTorch操作的运行速度提高了10至100倍，标志着AI技术在GPU性能优化领域的重大突破。 Sakana AI表示，CUDA内核作为GPU计算的核心，直接编写和优化通常需要深厚的专业知识和高技术门槛，而现有框架如PyTorch虽然使用便捷，但在性能上往往无法与手动优化的内核媲美。

2/21/2025 5:26:00 PM

AI在线

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型

近日，网络安全研究人员发现，在知名机器学习平台 HuggingFace 上，有两个恶意的机器学习模型悄然上传。这些模型使用了一种新奇的技术，通过 “损坏” 的 pickle 文件成功规避了安全检测，令人担忧。 ReversingLabs 的研究员卡洛・赞基（Karlo Zanki）指出，从这些 PyTorch 格式的存档中提取的 pickle 文件开头，暗示了其中包含恶意的 Python 代码。

2/10/2025 11:11:00 AM

AI在线

机器学习的下一个前沿—量子扩展

译者 | 陈峻审校 | 重楼现如今，机器学习的速度比以往任何时候都快得多，也能够解决那些曾被认为完全无法解决的问题。将来，在量子计算潜力的驱动下，人工智能（AI）模型会越来越大、越来越强，甚至会超越我们对其训练的工具。说到模型训练，其计算和能源的消耗成本日趋高启。

1/21/2025 8:11:24 AM

陈峻

Torchtune：重塑大语言模型微调的新篇章

在当今的深度学习领域，大语言模型（LLMs）的微调已成为实现定制化模型功能的关键步骤。为了满足这一需求，Torchtune应运而生，它是一个专为PyTorch设计的库，旨在简化LLMs的编写、微调及实验过程。本文将详细介绍Torchtune的功能、特性、使用方法及其社区支持。

1/14/2025 10:56:14 AM

tune

PyTorch vs PyTorch Lightning 框架对比

在不断发展的深度学习领域，PyTorch 已经成为开发者和研究人员家喻户晓的名字。其动态计算图、灵活性以及广泛的社区支持使其成为构建从简单神经网络到复杂前沿模型的首选框架。然而，灵活性也带来了编写大量样板代码的责任——尤其是在训练循环、日志记录和分布式学习方面。

1/8/2025 8:30:38 AM

二旺

Pytorch 核心操作全总结！零基础必备！

在深度学习与人工智能领域，PyTorch已成为研究者与开发者手中的利剑，以其灵活高效的特性，不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说，深入了解其核心操作不仅是提升技能的关键，也是迈向高级应用与创新研究的必经之路。本文精心梳理了PyTorch的核心操作，这不仅是一份全面的技术指南，更是每一个PyTorch实践者的智慧锦囊，建议收藏！

12/31/2024 7:00:00 AM

小喵学AI

基于CNN＋PyTorch实现视觉检测分类

译者 | 朱先忠审校 | 重楼本文给出了一个使用CNN＋PyTorch实现汽车电子行业视觉检测分类详尽的实战案例解析。在本文中，我们开发了一个卷积神经网络（CNN），用于汽车电子行业的视觉检测分类任务。在此过程中，我们深入研究了卷积层的概念和相关数学知识，并研究了CNN实际看到的内容以及图像的哪些部分导致它们做出决策。

12/16/2024 8:06:42 AM

朱先忠

使用Pytorch构建视觉语言模型（VLM）

视觉语言模型（Vision Language Model，VLM）正在改变计算机对视觉和文本信息的理解与交互方式。本文将介绍 VLM 的核心组件和实现细节，可以让你全面掌握这项前沿技术。我们的目标是理解并实现能够通过指令微调来执行有用任务的视觉语言模型。

11/19/2024 1:17:38 PM

Achraf Abbaoui

PyTorch 深度学习的十个核心概念

深度学习是当前最热门的技术之一，而 PyTorch 是一个非常受欢迎的深度学习框架。今天，我们将深入探讨 PyTorch 中的 10 个核心概念，帮助你更好地理解和使用这个强大的工具。张量（Tensor）张量是 PyTorch 中最基本的数据结构，类似于 NumPy 的数组，但可以在 GPU 上运行，从而加速计算。

11/11/2024 8:00:00 AM

小白PythonAI编程

用 PyTorch 构建神经网络的 12 个实战案例

用PyTorch构建神经网络是机器学习领域中非常热门的话题。 PyTorch因其易用性和灵活性而受到广大开发者的喜爱。本文将通过12个实战案例，带你从零开始构建神经网络，逐步掌握PyTorch的核心概念和高级技巧。

11/5/2024 4:19:55 PM

手把手PythonAI编程

天下苦英伟达久矣！PyTorch官方免CUDA加速推理，Triton时代要来？

近日，PyTorch 官方分享了如何实现无 CUDA 计算，对各个内核进行了微基准测试比较，并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。在做大语言模型（LLM）的训练、微调和推理时，使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与计算范畴，同样严重依赖 CUDA，使用它加速的机器学习模型可以实现更大的性能提升。虽然 CUDA 在加速计算领域占据主导地位，并成为英伟达重要的护城河之一。但其他一些工作的出现正在向 CUDA 发起挑战，比如 OpenAI 推出的 Tr

9/9/2024 2:56:00 PM

机器之心

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

用 FlexAttention 尝试一种新的注意力模式。理论上，注意力机制就是你所需要的一切。然而在实际操作中，我们还需要优化像 FlashAttention 这样的注意力机制的实现。尽管这些融合的注意力机制大大提高了性能，且支持长上下文，但这种效率的提升也伴随着灵活性的丧失。对于机器学习研究人员来说，这就像是一种「软件彩票」—— 如果你的注意力变体不适合现有的优化内核，你将面临运行缓慢和 CUDA 内存不足的困境。一些注意力变体包括因果注意力、相对位置嵌入、Alibi、滑动窗口注意力、PrefixLM、文档掩码

8/11/2024 11:01:00 AM

机器之心

PyTorch 团队首发技术路线图，近百页文档披露 2024 下半年发展方向

最近，PyTorch 团队首次公布了开发路线图，由内部技术文档直接修改而来，披露了这个经典开源库下一步的发展方向。如果你在 AI 领域用 Python 开发，想必 PyTorch 一定是你的老朋友之一。2017 年，Meta AI 发布了这个机器学习和深度学习领域的开源库，如今已经走到了第 7 个年头。根据 Assembly AI 2021 年的统计数据，HuggingFace 上最受欢迎的 top 30 模型都能在 PyTorch 上运行，有 92% 的模型是 PyTorch 专有的，这个占比让包括 Tensor

7/15/2024 7:13:07 PM

清源

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

PyTorch

使用PyTorch和Hugging Face构建一个自动语音识别系统

融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践

PyTorch领军人物Horace He从Meta离职 加入OpenAI前CTO创立的初创公司

PyTorch 灵魂人物 Horace He 从 Meta 出走，选择 OpenAI 前 CTO 初创公司

PyTorch内存优化的十种策略总结：在有限资源环境下高效训练模型

Sakana AI发布“AI CUDA工程师”：自动化优化CUDA内核，速度提升高达100倍

黑客利用 “损坏” pickle 文件在 HuggingFace 上传恶意 AI 模型

机器学习的下一个前沿—量子扩展

Torchtune：重塑大语言模型微调的新篇章

PyTorch vs PyTorch Lightning 框架对比

Pytorch 核心操作全总结！零基础必备！

基于CNN＋PyTorch实现视觉检测分类

使用Pytorch构建视觉语言模型（VLM）

PyTorch 深度学习的十个核心概念

用 PyTorch 构建神经网络的 12 个实战案例

天下苦英伟达久矣！PyTorch官方免CUDA加速推理，Triton时代要来？

新PyTorch API：几行代码实现不同注意力变体，兼具FlashAttention性能和PyTorch灵活性

PyTorch 团队首发技术路线图，近百页文档披露 2024 下半年发展方向

PyTorch领军人物Horace He从Meta离职加入OpenAI前CTO创立的初创公司