DeepSeek搭建个人知识库教程,你学会了吗?

各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了? 你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。 我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!

各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了?你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!

不过,今天我要给大家分享一个超实用的技巧:利用 DeepSeek 创建专属的 AI 知识库!我自己已经开始使用这个方法了,效果简直出乎意料地好。它不仅让 AI 变得超可靠,还从根本上消除了商业机密泄露的风险。

其实,在 AI 出现之前,私有知识库就已经在很多场景中发挥了巨大作用,比如企业内部知识管理、个人知识储备等。而当它与出色的 DeepSeek 相结合后,知识检索和归纳的效率简直提升到了一个新的高度。

小白快速搭建个人 AI 知识库

个人 AI 知识库的方案多种多样,今天我来介绍一种既简单又高效的方法,特别适合新手。这种方法结合了 AnythingLLM 和 DeepSeek R1,不仅操作简单,而且知识检索效果出色。

工具简介

  • AnythingLLM:这是一个知识库管理的前端工具,提供从上传知识、向量化数据到检索增强生成(RAG)的全流程服务。它完全开源且免费,非常适合个人用户。
  • DeepSeek R1:这是幻方量化推出的大模型,性能与 Claude 3.5 相当,但 Token 成本极低。在本次方案中,我们将使用 DeepSeek R1 作为推理模型。

注意事项

  • 模型选择:虽然我们推荐使用 DeepSeek R1,但 AnythingLLM 也支持其他推理模型,如 GPT、Claude,或者通过 Ollama 运行本地开源模型等。你可以根据自己的需求选择合适的模型。

通过这种组合,你可以轻松搭建一个高效、低成本的个人 AI 知识库,无论是学习、工作还是研究,都能大大提高你的效率。希望这个方案对你有所帮助!

安装 AnythingLLM

下载 AnythingLLM

地址:https://anythingllm.com/

AnythingLLM 是一个开源且免费的工具,采用 MIT 许可证,支持文本和多模态大语言模型(LLM)在同一界面中使用。它能够轻松处理图像和音频。

该工具也适合用作强大的 API,便于任何自定义开发或现有产品的功能扩展。AnythingLLM 拥有不断增长的插件和集成生态系统,可以增强其在应用和组织中的功能。

设计上,AnythingLLM 默认是私密的,所有数据都存储并在运行该工具的本地机器上处理。用户可以轻松下载并运行 LLM,无需额外的设置或程序。

AnythingLLM Desktop 并不是 SaaS 服务,用户无需注册即可在本地使用完整的工具套件。

此外,AnythingLLM 可以根据公司的品牌进行白标定制,并支持多个用户在同一服务器上使用,确保用户之间的完全隔离。管理员可以细致控制用户的权限和可见内容。

支持系统:Windows、Mac、Linux

图片图片

图片图片

图片图片图片图片图片图片图片图片图片图片

配置 AI 大脑(如何使用 DeepSeekAPI 或者本地搭建 DeepSeek)

设置你的 AI 助手:DeepSeek

打开软件后,首先需要配置 LLM(大型语言模型)。这里推荐选择 DeepSeek 作为你的模型,具体选择“chat”选项,这是目前最新的模型版本。为了使用 DeepSeek 的服务,你需要一个 API Key。你可以通过访问 DeepSeek 的官网

https://platform.deepseek.com

注册账号并获取 API Key。注册过程简单,充值少量费用(几块钱)即可开始使用,非常经济实惠。

图片图片

图片

您可能会遇到这样的提示:“目前我们正在进行网站的维护与升级工作,网站暂时无法正常使用。我们正在全力推进相关工作,争取尽快恢复服务。感谢您在此期间的理解与耐心等待。”

如果官网的 API 暂时无法使用,您可以考虑使用本地部署版本的 DeepSeek。关于如何进行本地部署,可以参考文档,

本地部署 DeepSeek:打造你的专属 AI 推理环境,简单明了适合新手

进入工作区

可以在左下角设置按钮中进行基础配置,如:LLM、嵌入模型、向量数据库选择等,新手可以先保持默认设置。

(这里单独提下 Embedding 模型,Embedding 是将高纬度数据嵌入低纬度空间方便存储,模型性能影响对后续知识

检索有挺大影响,建议可以换成 bge-m3,这个模型对多语言和长文本都支持的不错,需要本地运行 0llama 加载这

个模,由于需要安装 0llama,新手可以跳过这一步)

图片

图片图片

上传文档

  • 点击工作空间的上传按钮,

图片图片

图片

  • 支持上传 PDF、CSV、音频或者抓取网页内容等等。上传后右键加入工作空间就 ok 了。

图片图片

一定要点击 save 按钮,不然不会生效。

图片图片

图片

  1. 可以在 Data Connnector 中获取 youtube(需要有 cc 字幕)视频、confluence 文档库等内容平台的数据。

图片图片

知识检索问答

  • 工作区点击 new thread 可以开启新的对话,然后提问就 ok 了

图片图片

  • 果想判断 LLM 回答的知识范围,可以在回答的底部点开:Show Citations 就能看到引用了哪些知识

图片

AnythingLLM 是一个很强大的知识库管理工具,新版本还提供了 Agent 模式,可以接入谷歌、bing 等搜索引擎,实现实时搜索增加检索的时效性。

相关资讯

纪念碑谷式错觉图像都被「看穿」,港大、TikTok的Depth Anything火了

人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计(MDE)。近日,一种可有效利用大规模无标注图像的新 MDE 模型  Depth Anything 凭借强大的性能在社交网络上引起了广泛讨论,试用者无不称奇。甚至有试用者发现它还能正确处理埃舍尔(M.C.Escher)那充满错觉的绘画艺术(启发了《纪念碑谷》等游戏和艺术):从水上到水下,丝滑切换:更好的深度模型也得到了效果更好的以深度为条件的 Contr

CVPR 2024 | 分割一切模型SAM泛化能力差?域适应策略给解决了

第一个针对「Segment Anything」大模型的域适应策略来了!相关论文已被CVPR 2024 接收。引言大语言模型(LLMs)的成功激发了计算机视觉领域探索分割基础模型的兴趣。这些基础分割模型通常通过 Prompt Engineer 来进行 zero/few 图像分割。其中,Segment Anything Model(SAM)是最先进的图像分割基础模型。                             图  SAM 在多个下游任务上表现不佳但是最近的研究表明,SAM 在多种下游任务中并非具有很强的

GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程、技术挑战与解决方法,分享了团队对于 Scaling Laws 在单一视觉任务方面的思考。值得一提的是,Depth Anything V1 与 V2 两个版本论文一作是团队实习生。近日,字节跳动大模型团队开发的成果 Depth Anything V2 ,入选苹果公司 Core ML 模型库,目前已呈现在开发者相关页面中。Depth Anything 是一