突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率

百度于 2025 年 1 月 23 日公布最新研究成果 EICopilot,利用大型语言模型(LLM)简化了从数据库中提取信息的流程,为企业知识图谱探索提供了高效解决方案。

百度于 2025 年 1 月 23 日公布最新研究成果 EICopilot,利用大型语言模型(LLM)简化了从数据库中提取信息的流程,为企业知识图谱探索提供了高效解决方案。

项目背景

知识图谱近来在企业领域得到了广泛应用,涵盖法人、注册资本、股东信息等多维度数据。尽管图谱具有很高的实用性,但由于复杂的文本查询和手动探索限制,阻碍有效提取信息。

EICopilot 简介

EICopilot 由百度研究院开发,是一个基于 AI 智能体的解决方案,可简化存储在知识图谱数据库中的企业数据的搜索、探索和摘要,从而有效地获得有关企业的宝贵见解。

EICopilot 处理的数据集包含数亿节点、数百亿边(edges)、数千亿属性以及数百万子图,涵盖国家注册企业、组织和公司等信息。

研究人员收集真实企业相关查询,构建种子数据集,并使用 Gremlin 语言编写搜索脚本,通过系统标注和增强,形成向量数据库,提高搜索精度。

突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率

EICopilot 是一个基于 LLM 的聊天机器人,采用创新的数据预处理流程优化数据库查询,利用向量数据库实时生成搜索空间,实现高效的图谱检索和探索。

EICopilot 还具备强大的推理能力,采用思维链(CoT)和上下文学习(ICL)等技术,提供更精准的查询响应。

EICopilot 性能

研究人员使用百度内部数据平台的数据,构建了包含查询和图数据库查询对的数据集,根据查询的遍历长度,将查询分为简单、中等和复杂三类,并采用语法错误率(SyntaxErrorRate)和执行正确率(Execution Correctness)评估 EICopilot 的性能。

突破瓶颈,百度 EICopilot AI 提升企业知识图谱利用率

实证结果表明,EICopilot 的性能优于基线方法,尤其在速度和准确性方面。Full Mask 版本的 EICopilot 语法错误率低至 10.00%,执行正确率高达 82.14%。

AI在线附上参考地址

  • Baidu Research Introduces EICopilot: An Intelligent Agent-based Chatbot to Retrieve and Interpret Enterprise Information from Massive Graph Databases

  • EICopilot: Search and Explore Enterprise Information over Large-scale Knowledge Graphs with LLM-driven Agents

相关资讯

李彦宏数千万元投资大模型创业公司 鼓励创业者坚持长期主义

李彦宏表示,智能体最明显的特点是门槛足够低,谁都能上手,但同时天花板又足够高,可以做出非常复杂,非常强大的应用。 未来,将会有数以百万量级的智能体出现,形成庞大的智能体生态。 值得一提的是,在今年文心杯创业大赛中,有超过60%参赛团队聚焦智能体的应用,超过30%参赛团队没有专业程序员。

百度李彦宏:智能体是我最看好的 AI 应用方向

在今日的 2024 百度云智大会上,“文心杯”创业大赛第二季结果揭晓。百度创始人李彦宏发表颁奖致辞时指出,智能体是他最看好的 AI 原生应用发展方向,相当于 PC 时代的网站和自媒体时代的账号。李彦宏表示,智能体最明显的特点是门槛足够低,谁都能上手,但同时天花板又足够高,可以做出非常复杂,非常强大的应用。未来,将会有数以百万量级的智能体出现,形成庞大的智能体生态。AI在线注意到,在今年文心杯创业大赛中,有超过 60% 参赛团队聚焦智能体的应用,超过 30% 参赛团队没有专业程序员。“百度希望能与所有的创业领域企业共

“自由画布”开启公测!百度文库AI功能MAU超9000万

1月21日,在百度AI DAY活动上,百度副总裁,文库事业部、网盘事业部负责人王颖透露,百度文库AI功能MAU已突破9000万,同时,由百度文库和百度网盘联合打造的AI创作新物种“自由画布”开启公测。  过去一年,百度文库用户数据呈高速增长,其AI功能MAU已突破9000万,AI DAU年同比增长230%;付费用户超4000万,位居全球第二、中国第一。 自依托文心大模型进行全面AI重构以来,百度文库推出智能PPT、智能写作、AI全网搜、智能有声画本、智能漫画等上百项AI能力,覆盖学习办公、家庭教育、兼职赚钱场景。