DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

2025-02-05 03:40

据华为官方公众号，2 月 4 日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区，支持一键获取 DeepSeek 系列模型，支持昇腾硬件平台上开箱即用，推理快速部署。

感谢据华为官方公众号，2 月 4 日，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro 正式上线昇腾社区，支持一键获取 DeepSeek 系列模型，支持昇腾硬件平台上开箱即用，推理快速部署。

AI在线附模型调用方式如下：

权重转换

GPU：

git clone https://github.com/deepseek-ai/DeepSeek-V3.git
cd DeepSeek-V3/inference/
python fp8_cast_bf16.py --input-fp8-hf-path /path/to/DeepSeek-V3 --output-bf16-hf-path /path/to/deepseek-v3-bf16

NPU：

git clone https://modelers.cn/MindIE/deepseekv3.git
cd NPU_inference/
python fp8_cast_bf16.py --input-fp8-hf-path /path/to/DeepSeek-V3 --output-bf16-hf-path /path/to/deepseek-v3-bf16

加载镜像

在昇腾社区 / 开发资源下载适配 DeepSeek-V3 的镜像包：

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后，请使用 docker images 命令确认查找具体镜像名称与标签。

docker load -i mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64(下载的镜像名称与标签)

容器启动

提供的 MindIE 镜像预置了 DeepSeek-V3 模型推理脚本，从您信任的来源自行获取权重后，放置在从上述下载的模型代码的主目录下，修改模型文件夹属组为 1001，执行权限为 750，启动容器。

chown -R 1001:1001 /path-to-weights/deepseekv3
chowd -R 750 /path-to-weights/deepseekv3

服务化测试

配置服务化环境变量，expandable_segments-使能内存池扩展段功能，即虚拟内存特性。

export PYTORCH_NPU_ALLOC_CONF=expandable_segments:True

修改服务化参数

cd /usr/local/Ascend/mindie/latest/mindie-service/
vim conf/config.json

拉起服务化

#设置显存比
export NPU_MEMORY_FRACTION=0.95
#拉起服务化
cd /usr/local/Ascend/mindie/latest/mindie-service/ 
./bin/mindieservice_daemon

出现“Daemon start success!”，则认为服务成功启动。

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

华为技术有限公司今日宣布，MindSpeed 支持 DeepSeek V3 预训练、微调，同时昇腾还适配支持 DeepSeek-R1 复现项目 Open R1。

2/11/2025 5:58:54 PM

归泷（实习）

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

在AI技术日新月异的今天，大型语言模型已成为推动AI发展的重要力量。 2024年12月26日，DeepSeek AI正式发布了其最新的大型语言模型——DeepSeek-V3。这款开源模型采用了高达6710亿参数的混合专家（MoE）架构，每秒能够处理60个token，比V2快了3倍。

1/3/2025 7:38:33 PM

张诚

华为 ModelEngine AI 平台支持 DeepSeek 全系列本地部署

为技术有限公司今日发文宣布，旗下 ModelEngine AI 平台全面支持 DeepSeek 大模型 R1 & V3 和蒸馏系列模型的本地部署与优化。

2/6/2025 4:55:09 PM

归泷（实习）

资讯热榜

企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型上海AI实验室开源InternVL3系列多模态大型语言模型 50组多风格提示词，全面测评Midjourney V7生图效果！全日程揭晓！ICLR 2025论文分享会我们北京见斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！ ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人大语言模型 Copilot 神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部

DeepSeek 系列新模型上线华为昇腾社区：一键获取，开箱即用

权重转换

加载镜像

容器启动

服务化测试

相关资讯

华为昇腾适配支持 DeepSeek-R1 复现项目 Open R1

从DeepSeek-V3发布谈大模型的技术突破与未来机遇

华为 ModelEngine AI 平台支持 DeepSeek 全系列本地部署