向量数据库

RAG实战|向量数据库LanceDB指南

LanceDB介绍LanceDB是一个开源的用 Rust 实现的向量数据库（），它的主要特点是：提供单机服务，可以直接嵌入到应用程序中支持多种向量索引算法，包括Flat、HNSW、IVF等。支持全文检索，包括BM25、TF-IDF等。支持多种向量相似度算法，包括Cosine、L2等。

为什么AI需要向量数据库？

大模型火遍全球，DeepSeek、OpenAI、谷歌、百度、抖音等科技巨头争相发布自家产品。多数人会想当然认为，大模型越大越强大，参数量越多就越聪明。现实呢？

基于LangChain和云原生向量数据库Milvus开发混合搜索AI程序

译者 | 朱先忠审校 | 重楼本文将探讨基于LangChain框架和云原生向量数据库Milvus并将密集嵌入与稀疏嵌入结合起来开发混合搜索型AI程序的实战过程。简介最近，我们——来自IBM研究中心的团队——需要在Milvus向量存储中使用混合搜索技术。因为我们已经在使用LangChain框架，所以我们决定一鼓作气贡献出在langchain-milvus中启用这一功能所需的一切。

向量数据库的中场战事：长期主义者Zilliz如何全球突围

命运齿轮转动的开始，源于 2023 年的 3 月 23 日的 OpenAI 一次日常更新。这一天，OpenAI ChatGPT 发布了一个名叫 chatgpt-retrieval-plugin 的插件功能。而在官方 plugin 给出的标准案例中，OpenAI 专门提到，向量数据库是大模型产品形成长期记忆一个必不可少的组件。

3 月 11 日，零一万物宣布推出基于全导航图的新型向量数据库「笛卡尔（Descartes）」，其搜索内核已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。向量数据库，又被称为 AI 时代的信息检索技术，是检索增强生成（Retrieval-Augmented Generation, RAG）内核技术之一。对大模型应用开发者来说，向量数据库是非常重要的基础设施，在一定程度上影响着大模型的性能表现。在国际权威评测平台 ANN-Benchmarks 离线测试中，零一万物笛卡尔（Descartes）向

OpenAI开发者大会后的向量数据库和RAG，一起来这场论坛聊聊

十几天前的 OpenAI 开发者大会，给整个行业带来了一场地震。最新推出的 Assistants API 提供了代码解释器、检索以及函数调用等新功能，帮助开发者构建高质量的 AI 应用。于是，“OpenAI 力挺 RAG，向量数据库失宠了？”等话题一度成为了讨论的热点。很多从业者纷纷表示尽管 RAG 看似很完美，但是目前来看，向量数据库依然是不可忽视的一环，而它本身也是 RAG 的基本组件。尽管向量数据库和 RAG 的技术门槛并不算高，但是在实际应用中还是会出现各种各样的问题。如何发挥外挂知识库和向量数据库的最大价

低成本快速定制大模型，这次我们来深度探讨下RAG 和向量数据库

当今人工智能领域，最受关注的毋庸置疑是大模型。然而，高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下，向量数据库凭借其独特的优势，成为解决低成本快速定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技术。它采用高效的索引和查询算法，实现了海量数据的快速检索和分析。如此优秀的性能之外，向量数据库还可以为特定领域和任务提供定制化的解决方案。科技巨头诸如腾讯、阿里等公司纷纷布局向量数据库研发，力求在大模型领域实现突破。大量中小型公司也借助向量数据库的能力快速进

低成本快速入局大模型，你需要学下向量数据库

在 ChatGPT 等大语言模型（LLM）盛行的当下，一直不温不火的向量数据库（Vector Data Base ，VectorDB）开始受到大家的关注。一般而言，大模型在回答具有普遍性的问题上游刃有余，但在回答垂直专业的问题上，就显得不那么出色，例如，大模型在医疗行业会存在回答不准确的情况。这时，为大模型配备一个「超级大脑」变得尤为重要，这个「超级大脑」可以存储一些专有知识，这样一来，大模型就能从海量的数据中快速检索出最合适的答案，提高它们的准确性和效率，而向量数据库就充当了「超级大脑」角色。其实，早在 2013