GPT-4o 系列 AI 模型加持，微软 LlamaParse 文档解析能力全面升级

此次集成充分发挥了双方优势，LlamaParse 负责高效解析，Azure OpenAI 则提供强大的语言模型能力，最终实现更精准、更智能的文档处理。

微软于 11 月 26 日发布博文，宣布在其 LlamaParse 中集成 Azure OpenAI 端点，利用 GPT-4o 系列模型，增强提取非结构化数据和解析多模态文档，并无缝衔接 Azure AI Search 向量数据库，构建完整的检索增强生成（RAG）工作流程。

微软 LlamaParse 是一个专为生成式人工智能（GenAI）设计的文档解析器，其主要目标是解析和清理各种文档数据，在传递给下游大型语言模型 (LLM) 之前，确保数据质量。

微软 LlamaParse 在本次集成后，可以让用户调用 Azure OpenAI 的 GPT-4o 系列模型，提取非结构化数据和文档转换。此次集成充分发挥了双方优势，LlamaParse 负责高效解析，Azure OpenAI 则提供强大的语言模型能力，最终实现更精准、更智能的文档处理。

AI在线援引该媒体报道，附上本次更新内容如下：

用户可以利用 LlamaCloud、Azure AI Search 和 Azure OpenAI 构建一个完整的 RAG 工作流程，具体步骤包括：

解析与丰富: 使用 LlamaParse Premium 和 Azure OpenAI 进行高级文档提取，生成 Markdown、LaTeX 和 Mermaid 图表等多种格式的 LLM 优化输出。
分块和嵌入: 使用 Azure AI Search 作为向量存储，并利用 Azure AI 模型目录中的嵌入模型，对解析后的内容进行分块、嵌入和索引。
搜索与生成: 利用 Azure AI Search 的查询重写和语义重新排序功能，提升检索质量。最终，通过 Llamaindex 编排 Azure AI Search 和 Azure OpenAI，构建生成式 AI 应用。

{{userData.name}}已认证