SpringAI用嵌入模型操作向量数据库！

2025-04-02 12:00

嵌入模型（Embedding Model）和向量数据库（Vector Database/Vector Store）是一对亲密无间的合作伙伴，也是 AI 技术栈中紧密关联的两大核心组件，两者的协同作用构成了现代语义搜索、推荐系统和 RAG（Retrieval Augmented Generation，检索增强生成）等应用的技术基础。 “PS：准确来说 Vector Database 和 Vector Store 不完全相同，前者主要用于“向量”数据的存储，而 Vector Store 是用于存储和检索向量数据的组件。在 Spring AI 中，嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下：系统整体交互流程如下：接下来我们使用以下技术：Spring AI阿里云文本嵌入模型 text-embedding-v3SimpleVectorStore（内存级别存储和检索向量数据组件）实现嵌入模型操作内存级别向量数据库的案例。

“PS：准确来说 Vector Database 和 Vector Store 不完全相同，前者主要用于“向量”数据的存储，而 Vector Store 是用于存储和检索向量数据的组件。

在 Spring AI 中，嵌入模型 API 和 Spring AI Model API 和嵌入模型的关系如下：

SpringAI用嵌入模型操作向量数据库！

系统整体交互流程如下：

SpringAI用嵌入模型操作向量数据库！

接下来我们使用以下技术：

Spring AI
阿里云文本嵌入模型 text-embedding-v3
SimpleVectorStore（内存级别存储和检索向量数据组件）

实现嵌入模型操作内存级别向量数据库的案例。

1.添加项目依赖

我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的，因此，我们只需要添加 OpenAI 依赖即可：

复制

<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>

2.配置嵌入模型

阿里云百炼平台支持的向量模型：

SpringAI用嵌入模型操作向量数据库！

项目配置文件配置向量模型：

复制

spring:
  ai:
    openai:
      api-key: ${aliyun-ak}
      embedding:
        options:
          model: text-embedding-v3
      chat:
        options:
          model: deepseek-r1

3.配置向量模型

将 EmbeddingModel 和 VectorStore 进行关联，如下代码所示：

复制

@Bean
public VectorStore vectorStore(EmbeddingModel embeddingModel) {
return SimpleVectorStore.builder(embeddingModel).build();
}

4.向量数据库添加数据

VectorStore 提供的常用方法如下：

add(Listdocuments) ：添加文档。
delete(ListidList) ：按 ID 删除文档。
delete(Filter.Expression filterExpression) ：按过滤表达式删除文档。
similaritySearch(String query) 和 similaritySearch(SearchRequest request) ：相似性搜索。

向数据库添加向量数据的方法如下：

复制

// 构建测试数据
List<Document> documents =
List.of(new Document("I like Spring Boot"),
        new Document("I love Java"));
// 添加到向量数据库
vectorStore.add(documents);

当然，向量数据的数据源可以是文件、图片、音频等资源，这里为了简单演示整体执行流程，使用了更简单直观的文本作为数据源。

5.查询数据

复制

@RestController
@RequestMapping("/vector")
publicclass VectorController {

    @Resource
    private VectorStore vectorStore;

    @RequestMapping("/find")
    public List find(@RequestParam String query) {
        // 构建搜索请求，设置查询文本和返回的文档数量
        SearchRequest request = SearchRequest.builder()
        .query(query)
        .topK(3)
        .build();
        List<Document> result = vectorStore.similaritySearch(request);
        System.out.println(result);
        return result;
    }
}

执行结果如下：

SpringAI用嵌入模型操作向量数据库！

从上述结果可以看出，和“java”相似度最高的向量为“I love Java”，相似度评分为 0.77，如果我们 SearchRequest 对象中的 topK 设置为 1 的话，只会查询“I love Java”这条数据，如下图所示：

SpringAI用嵌入模型操作向量数据库！

“想要获取完整案例的同学加V：vipStone【备注：向量】

小结

嵌入模型和向量数据库是实现 RAG（检索增强生成）的技术基础，当然除了以上案例外，你可以使用 Redis 或 ES 来存储向量数据，并尝试加入 DeepSeek 实现 RAG 功能，这种形式更符合企业真实的技术应用。

Cohere 推出 Embed 4：全新多模式搜索模型可处理 200 页文档

在代理型 AI 热潮持续升温之际，企业检索增强生成 (RAG) 依然扮演着至关重要的角色。近日，紧抓市场对代理日益增长的兴趣，专注于企业级 AI 应用的 Cohere 发布了其最新嵌入模型 Embed 4。该模型在 Embed 3 的多模态能力基础上进行了显著增强，尤其在处理非结构化数据方面表现突出，并拥有高达 128，000 个 token 的超长上下文窗口，理论上能够为约 200 页的文档生成嵌入。

4/16/2025 10:01:54 AM

AI在线

RAG实战|向量数据库LanceDB指南

LanceDB介绍LanceDB是一个开源的用 Rust 实现的向量数据库（），它的主要特点是：提供单机服务，可以直接嵌入到应用程序中支持多种向量索引算法，包括Flat、HNSW、IVF等。支持全文检索，包括BM25、TF-IDF等。支持多种向量相似度算法，包括Cosine、L2等。

4/3/2025 4:02:14 PM

周末程序猿

低成本快速定制大模型，这次我们来深度探讨下RAG 和向量数据库

当今人工智能领域，最受关注的毋庸置疑是大模型。然而，高昂的训练成本、漫长的训练时间等都成为了制约大多数企业入局大模型的关键瓶颈。这种背景下，向量数据库凭借其独特的优势，成为解决低成本快速定制大模型问题的关键所在。向量数据库是一种专门用于存储和处理高维向量数据的技术。它采用高效的索引和查询算法，实现了海量数据的快速检索和分析。如此优秀的性能之外，向量数据库还可以为特定领域和任务提供定制化的解决方案。科技巨头诸如腾讯、阿里等公司纷纷布局向量数据库研发，力求在大模型领域实现突破。大量中小型公司也借助向量数据库的能力快速进

11/13/2023 12:05:00 PM

机器之心

资讯热榜

上海AI实验室开源InternVL3系列多模态大型语言模型 Haisnap横空出世，小白用户也能轻松打造AI应用「交交」媲美GPT-4o！上海交大推出口语对话情感大模型，首个纯学术界自研！ OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片 OPPO 小布助手网页版上线，接入满血版 DeepSeek 本地部署DeepSeek+DiFy平台构建智能体应用 kimi开源视觉语言模型 Kimi-VL 与 Kimi-VL-Thinking，多项基准超越 GPT-4o

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

SpringAI用嵌入模型操作向量数据库！

1.添加项目依赖

2.配置嵌入模型

3.配置向量模型

4.向量数据库添加数据

5.查询数据

小结

相关资讯

Cohere 推出 Embed 4：全新多模式搜索模型可处理 200 页文档

RAG实战|向量数据库LanceDB指南

低成本快速定制大模型，这次我们来深度探讨下RAG 和向量数据库