国产 GPU 助力，摩尔线程实现对 DeepSeek 蒸馏模型推理服务部署

作者：归泷（实习）

2025-02-04 11:38

DeepSeek 开源模型（如 V3、R1 系列）在多语言理解与复杂推理任务中展现了卓越性能。摩尔线程智能科技（北京）有限责任公司今日发文宣布，摩尔线程实现了对 DeepSeek 蒸馏模型推理服务部署。

感谢DeepSeek 开源模型（如 V3、R1 系列）在多语言理解与复杂推理任务中展现了卓越性能。摩尔线程智能科技（北京）有限责任公司今日发文宣布，摩尔线程实现了对 DeepSeek 蒸馏模型推理服务部署。

AI在线从摩尔线程官方获悉，通过 DeepSeek 提供的蒸馏模型，能够将大规模模型的能力迁移至更小、更高效的版本，在国产 GPU 上实现高性能推理。

开源框架适配：基于 Ollama 开源框架，摩尔线程完成 DeepSeek-R1-Distill-Qwen-7B 蒸馏模型的部署，并在多种中文任务中展现了优异的性能，验证摩尔线程自研全功能 GPU 的通用性与 CUDA 兼容性。
自研引擎加速：通过摩尔线程自主研发的高性能推理引擎，结合软硬件协同优化技术，通过定制化的算子加速和内存管理，显著提升了模型的计算效率和资源利用率。这一引擎不仅支持 DeepSeek 蒸馏模型的高效运行，还为未来更多大规模模型的部署提供了技术保障。

另外，用户也可以基于 MTT S80 和 MTT S4000 进行 DeepSeek-R1 蒸馏模型的推理部署，此前已有用户在 MTT S80 上手动完成实践。

相关标签：

DeepSeek 摩尔线程

相关资讯

摩尔线程支持 DeepSeek 开源周“全家桶”

摩尔线程支持 DeepSeek 开源周“全家桶”

摩尔线程宣布全面支持DeepSeek开源周的五大项目，包括FlashMLA、DeepEP、DeepGEMM、DualPipe和Fire-Flyer 文件系统（3FS）。#摩尔线程##DeepSeek开源周##DeepSeek#

3/2/2025 9:12:24 AM

归泷（实习）

摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

摩尔线程成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

在 DeepSeek 开源周第四日，摩尔线程宣布已成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe，并发布相关开源代码仓库：MT-DeepEP 和 MT-DualPipe。

2/27/2025 11:39:00 PM

归泷（实习）

Day0 级支持，摩尔线程官宣支持通义千问 QwQ-32B 开源模型

Day0 级支持，摩尔线程官宣支持通义千问 QwQ-32B 开源模型

3 月 6 日，阿里云团队正式开源全新推理模型 —— 通义千问 QwQ-32B。摩尔线程智能科技（北京）股份有限公司今日宣布在该模型发布后 2 小时内，完成对其支持。

3/6/2025 8:08:26 PM

归泷（实习）

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果深度学习 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部