向量数据库

基于LangChain和云原生向量数据库Milvus开发混合搜索AI程序

译者 | 朱先忠审校 | 重楼本文将探讨基于LangChain框架和云原生向量数据库Milvus并将密集嵌入与稀疏嵌入结合起来开发混合搜索型AI程序的实战过程。 简介最近,我们——来自IBM研究中心的团队——需要在Milvus向量存储中使用混合搜索技术。 因为我们已经在使用LangChain框架,所以我们决定一鼓作气贡献出在langchain-milvus中启用这一功能所需的一切。

向量数据库的中场战事:长期主义者Zilliz如何全球突围

命运齿轮转动的开始,源于 2023 年的 3 月 23 日的 OpenAI 一次日常更新。 这一天,OpenAI ChatGPT 发布了一个名叫 chatgpt-retrieval-plugin 的插件功能。 而在官方 plugin 给出的标准案例中,OpenAI 专门提到,向量数据库是大模型产品形成长期记忆一个必不可少的组件。

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,其搜索内核已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。向量数据库,又被称为 AI 时代的信息检索技术,是检索增强生成(Retrieval-Augmented Generation, RAG)内核技术之一。对大模型应用开发者来说,向量数据库是非常重要的基础设施,在一定程度上影响着大模型的性能表现。在国际权威评测平台 ANN-Benchmarks 离线测试中,零一万物笛卡尔(Descartes)向

OpenAI开发者大会后的向量数据库和RAG,一起来这场论坛聊聊

十几天前的 OpenAI 开发者大会,给整个行业带来了一场地震。最新推出的 Assistants API 提供了代码解释器、检索以及函数调用等新功能,帮助开发者构建高质量的 AI 应用。于是,“OpenAI 力挺 RAG,向量数据库失宠了?”等话题一度成为了讨论的热点。很多从业者纷纷表示尽管 RAG 看似很完美,但是目前来看,向量数据库依然是不可忽视的一环,而它本身也是 RAG 的基本组件。尽管向量数据库和 RAG 的技术门槛并不算高,但是在实际应用中还是会出现各种各样的问题。如何发挥外挂知识库和向量数据库的最大价

低成本快速定制大模型,这次我们来深度探讨下RAG 和向量数据库

当今人工智能领域,最受关注的毋庸置疑是大模型。然而,高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下,向量数据库凭借其独特的优势,成为解决低成本快速定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技术。它采用高效的索引和查询算法,实现了海量数据的快速检索和分析。如此优秀的性能之外,向量数据库还可以为特定领域和任务提供定制化的解决方案。科技巨头诸如腾讯、阿里等公司纷纷布局向量数据库研发,力求在大模型领域实现突破。大量中小型公司也借助向量数据库的能力快速进

低成本快速入局大模型,你需要学下向量数据库

在 ChatGPT 等大语言模型(LLM)盛行的当下,一直不温不火的向量数据库(Vector Data Base ,VectorDB)开始受到大家的关注。一般而言,大模型在回答具有普遍性的问题上游刃有余,但在回答垂直专业的问题上,就显得不那么出色,例如,大模型在医疗行业会存在回答不准确的情况。这时,为大模型配备一个「超级大脑」变得尤为重要,这个「超级大脑」可以存储一些专有知识,这样一来,大模型就能从海量的数据中快速检索出最合适的答案,提高它们的准确性和效率,而向量数据库就充当了「超级大脑」角色。其实,早在 2013
  • 1