AI在线 AI在线

AI知识库的真相,你知道吗?

作者:程序员NEO
2025-04-30 09:06
很多人对AI知识库的想象是这样的,他们以为只需将所有资料一股脑地拖进AI客户端,比如 Cherry Studio 内。 图片这样,AI就会认真阅读所有内容,并自动生成完美结论。 然而,实际体验后,许多人发现AI知识库的效果远没有想象中理想,经常遇到各种奇怪的问题。

很多人对AI知识库的想象是这样的,他们以为只需将所有资料一股脑地拖进AI客户端,比如 Cherry Studio 内。

图片图片

图片

这样,AI就会认真阅读所有内容,并自动生成完美结论。

然而,实际体验后,许多人发现AI知识库的效果远没有想象中理想,经常遇到各种奇怪的问题。

本文将从知识库的原理出发,探讨AI知识库的技术局限。同时,我会介绍一些进阶方案,例如引入重排序模型、数据库(mcp server),以及使用超大上下文模型等方法。

目前,大模型知识库最常见的技术是RAG(检索增强生成)。

当用户将资料加入知识库时,程序会先将其拆分为多个文本块。

图片图片

随后,使用嵌入模型将这些文本块向量化。

向量化指将拆分后的文本转化为一组超长的数字序列。

图片图片

以我自己的知识库为例,这里用到的嵌入模型输出的是1024维:

图片图片

也就是说,每个文本块都被转换成一个由1024个数值组成的向量:

图片图片

之后,程序会将向量及其对应文本存储到向量数据库中。

图片图片

接下来,当用户发起提问时,问题本身也会被向量化,转化为一个1024维向量。

图片图片

然后,系统会将用户问题的向量与数据库中的所有向量进行相似度计算,这一过程完全基于向量的数学运算。

图片图片

最终,知识库会选出与问题最相似的几个原文片段,将它们与用户的问题一同发送给大模型,由大模型进行归纳总结。

图片图片

从这个流程可以看到,在RAG架构中,大模型主要负责归纳总结,答复质量在很大程度上取决于文本块的检索精度。事实上,RAG系统普遍存在切片粗暴、检索不精准、缺乏整体视角等典型问题。

相关标签:

相关资讯

快看:正在研发二次元垂类大模型,智能问答及 IP 角色互动应用已启动内测

快看搜索研发团队资深算法工程师田贵成于 7 月 11 日的 Zilliz“User Tech”活动中透露,快看漫画目前在尝试基于开源大模型进行微调,训练快看在二次元领域的垂直大模型。AI在线从快看方面获悉,快看宣称其内部有非常丰富的 RAG (Retrieval-Augmented Generation,检索增强生成)应用场景,目前在 AI 智能问答和 IP 角色互动两个场景已取得实质性进展,相关 AI 产品也正在内测,用户未来也将很快能体验到新产品的功能。据介绍,IP 角色互动背后的实现方案系角色扮演大模型
7/13/2024 10:15:34 PM
清源

微信资源直通DeepSeek-R1啦!打工人:哎呀妈(ima)

AI好好用报道编辑:SiaAI 产品都发现了引流新方法 ——DeepSeek-R1。 打工人の AI 外挂,又双叒升级啦! 今天,腾讯旗下智能工作台 ima.copilot( 简称 ima )喜提「双模双待」:左持腾讯混元大模型,右牵 DeepSeek-R1。
2/13/2025 11:01:00 AM
AI好好用

知乎直答推出全新版本:降低AI幻觉 回答可直接溯源答主

3月24日,知乎直答正式推出了全新版本,旨在进一步强化AI工具与知乎社区创作者的融合,提升内容的专业性和可信度。 据悉,知乎直答新版本在功能上进行了多项创新。 用户不仅可以上传解析网页、文档等知识库,还可以将每个知乎答主视为一个独立的知识库。
3/25/2025 8:18:00 AM
AI在线
  • 1