DeepSeek冲击（含本地化部署实践）

2025-02-18 12:04

DeepSeek无疑是春节档最火爆的话题，上线不足一月，其全球累计下载量已达4000万，反超ChatGPT成为全球增长最快的AI应用，并且完全开源。那么究竟DeepSeek有什么魔力，能够让大家趋之若鹜，他又将怎样改变世界AI格局和我们的生活，本篇文章将进行简要解析。 DeepSeek与ChatGPT对比说到人工智能就不得不提OpenAI和ChatGPT，这是绕不开的话题，要分析DeepSeek的实力，最简单的方式就是跟ChatGPT进行对比。

DeepSeek无疑是春节档最火爆的话题，上线不足一月，其全球累计下载量已达4000万，反超ChatGPT成为全球增长最快的AI应用，并且完全开源。那么究竟DeepSeek有什么魔力，能够让大家趋之若鹜，他又将怎样改变世界AI格局和我们的生活，本篇文章将进行简要解析。

DeepSeek与ChatGPT对比

说到人工智能就不得不提OpenAI和ChatGPT，这是绕不开的话题，要分析DeepSeek的实力，最简单的方式就是跟ChatGPT进行对比。

模型分类

ChatGPT目前有两种大模型，分别是面向普通用户，解决日常应用问题的4-OMNI，以及面向专业用户，处理深度思考问题的O1，DeepSeek与之对标的分别是V3模型以及R1模型。

图片

实用效果

据我目前的使用体验下来，DeepSeek的实际体验效果完全不输ChatGPT，甚至在解决数学、物理和推理问题方面表现出色，响应速度比ChatGPT还要快，且能够完整地展示其思考和给出答案的过程，例如最经典的，让绝大多数AI翻车的“1.11和1.9谁大？”的问题，ChatGPT给出的回答是：

图片

前言不搭后语，而反观DeepSeek：

图片

可以看到DeepSeek不仅给出了正确答案，而且展示了详细的解题思路，甚至有最后的验证。我也测试了许多其他的问题，DeepSeek完全不拉垮，相对于ChatGPT，他在中文领域的问题理解和处理更加到位，使用体验非常好。

这无疑也使得苹果公司柳暗花明又一村，为弥补apple intelligence上在中国区无法使用ChatGPT提供了完美的解决方案。

成本

成本分为两部分：硬件成本和训练成本。AI大模型构建算法绝大部分都是基于公开的论文，所以市场上的大模型，底层逻辑都大同小异，训练数据也来自于互联网，所以主要的成本体现在硬件上，也就是提供AI算力的芯片，自从AI大爆发以来，大家的共识就是堆砌的芯片越多，大模型的表现就越优秀。我先简单介绍一下为什么提升AI的性能就要堆砌大量的芯片。

AI算力的芯片领域是英伟达（Nvidia）一家独大，芯片价格非常昂贵，目前该公司最先进的B200芯片单张的价格就高达4万美金，而且对于AI公司来说你还必须买，因为芯片的产能有限，如果你不抢就会被竞争对手买走，导致你的大模型算力不如他的。

图片

英伟达公司为自家的芯片研发了一种叫CUDA的核心的技术，其全名叫做Compute Unified Device Architecture（统一计算设备架构）。

这是一种并行计算平台和编程模型。开发者通过它，可以间接利用GPU的处理能力，大幅提升计算性能。简单的说，CUDA核心就像是一间间的海水提纯工厂，它可以把如海洋般的GPU算力转换成AI开发者可以直接使用的AI算力，越多的CUDA核心数量就意味着更大的AI算力。

这也就是为什么AI行业越发展，芯片的需求量越大，英伟达的市值就越高。美国也多次通过英伟达“锁算力”以及限制芯片出口，阻碍中国的AI发展。AI行业的发展被一家公司扼住喉咙的现象显然极度不合理，英伟达可谓是真正的万恶之源。

OpenAI不受限制，所以囤积了大量的英伟达芯片，训练ChatGPT据传用到了5万张英伟达的芯片，而DeepSeek作为中国公司，在这方面相比自然相去甚远。

DeepSeek冲击

由于CUDA技术被英伟达牢牢掌握，所以间接提高了所有AI大模型的使用成本，阻碍了AI的发展。以ChatGPT为例，4-OMNI和O1两个大模型的研发成本高达数十亿美金，免费用户使用有诸多限制，付费用户每月20美金，专业用户每月200美金，如果企业想要接入OpenAI的人工智能服务，调用API做客服等用途，则更是按字符收费，虽然比人工客服省钱，但也是一笔不小的开销。这些收入中，绝大多数都是用来平衡购买芯片带来的巨大成本。

DeepSeek之所以引起全球瞩目，就是因为他在“芯片”受限的前提下，达到了与ChatGPT近似的使用体验，甚至在某些领域还远远超过了。OpenAI和它的母公司微软囤积了大量的高端芯片，而DeepSeek手里的芯片，不论从数量还是质量上都不占优势，甚至可以说远远落后。

在深度解析DeepSeek开源的模型代码之后，研究人员发现，DeepSeek之所以能够绝地反击，秘诀就在于他绕过了CUDA核心的限制，使用了完全创新的技术训练大模型，直接利用英伟达的底层技术调用了GPU的算力，相当于能直接使用如大海般的GPU资源，所以才能使用低端的芯片，在极短的时间内完成了模型的训练，达到了与ChatGPT近似的效果。

而且此技术成功解除了AI模型对英伟达芯片的依赖，使DeepSeek可以使用华为的芯片进行训练。DeepSeek服务调用的费用只有ChatGPT的十分之一，具有非常高的性价比和广阔的应用前景。

整体来说，DeepSeek用了很少的钱，很低端的工具，就把美国投入上百亿美元的事给办了。自从DeepSeek爆火之后，市场普遍认为英伟达的芯片估值过高，要实现高性能的AI并不需要如此之贵的芯片，最高端的芯片也并不值那个价钱，这直接导致英伟达的股价当天就暴跌17%，创造了美国股市历史上单日最大跌幅，截至目前英伟达市值蒸发近6000亿美元。

技术曝光的第二天，英伟达，微软和亚马逊的计算平台都宣布接入DeepSeek模型，堪称AI界的“斯普特尼克时刻”，就如同当年苏联率先成功发射人造卫星时一样，让一直以为自己在技术上遥遥领先的西方世界陷入了一片混乱，世界AI市场的格局就此改变。

本地化部署R1模型

DeepSeek虽然好，但是用过的同学都知道他有个致命的问题，就是万恶的资本主义经常组织针对DeepSeek的网络攻击，导致使用时出现“服务器繁忙的问题”。

图片

为了避免被攻击，降低延迟和卡顿，规避共享敏感信息的风险，同时更灵活的进行微调和实验，我们可以把R1模型部署到本地。

安装Ollama

首先登陆Ollama官网：https://ollama.com/。打开官网，然后点击下载，之后安装到本地。

图片

拉取 DeepSeek R1 模型

然后打开Ollama 的模型列表：https://ollama.com/library/deepseek-r1 ，搜索到DeepSeek R1：

图片

显卡需求

各个模型版本需求的显卡档次大致如下表：

图片

我们普通的电脑安装1.5B，7B就可以使用，然后在【右上角的的代码】复制，打开终端，输入上述下载命令回车后，会出现模型下载进度，当进度为100%就说明该模型已经下载到本地了。

图片

输入ollama list可以查看安装的模型。

图片

此时已经可以在控制台使用R1模型进行问答了。

包装GUI

只能在命令行中使用既不美观也特别的不方便，所以我们可以使用现成的GUI进行包装，相当于包上图形用户界面。这里以Cherry Studio为例，下载对应版本后打开。

图片

在设置中选择模型服务，选中Ollama

图片

填入对应的本地模型信息：

图片

DeepSeek 实现任务调度分片算法 , 灵性十足，远超预期 !

这几天，中国人工智能公司 DeepSeek 火了，不仅在美区下载榜上超越了 ChatGPT ，还引发多个美国科技股的股价暴跌。美国总统特朗普称 DeepSeek 的出现“给美国相关产业敲响了警钟”。于是，怀着极强的好奇心，我尝试让 DeepSeek V3 模型帮我完成任务调度系统分片功能，流程见下文。

2/3/2025 10:00:00 AM

勇哥

DeepSeek日活用户数突破2000万，增长势头远超ChatGPT

国内AI产品榜的最新统计数据显示，DeepSeek应用在上线仅20天后，其日活跃用户数（DAU）迅速突破2000万大关，具体数字高达2215万。这一成绩不仅彰显了DeepSeek强大的用户吸引力，也进一步证明了AI技术在当今社会的广泛应用和巨大潜力。用户增长迅猛，全球影响力显著提升日活用户数：截至2025年2月4日，DeepSeek的日活跃用户数已突破2000万，达到2215万。

2/6/2025 4:20:41 PM

极客AI

如何利用 DeepSeek-R1 本地部署强大的推理模型：从 ChatGPT 风格界面到 API 集成

01、概述随着开源推理模型如 DeepSeek-R1 的崛起，开发者可以在本地运行强大的 AI，而不再依赖于云服务。这一技术的出现引发了不小的网络热议，或许你也在好奇如何利用这一模型在本地搭建自己的 AI 系统。本指南将带你了解两种关键的使用场景：普通用户：创建一个 ChatGPT 风格的界面开发者：通过 API 集成模型到应用中在开始之前，如果你有兴趣深入了解 DeepSeek-R1 的背景，以便更好地理解接下来的过程，可以参考我的文章《DeepSeek-R1 理论简介（适合初学者）》。

2/12/2025 2:09:31 PM

基咯咯

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o 韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发击败DeepSeek-R1！豆包新推理模型仅用前者参数量1/3！还将开源两个基准，瞄准通用推理能力！谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果 AI视频模态人形机器人驾驶 xAI 文本搜索字节跳动大语言模型 Copilot Claude 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练

顶部