9 月 8 日下午,中国工程院院士、清华大学算计机系教授、海致科技首席科学家郑纬民在北京演示公布了由海致科技与高性能图算计院士工作站共同开发的 “Atlas LLM 学问图谱与大模型交融运用平台”,该平台面向广大 B 端用户,运用学问图谱这项人工智能底子技能,帮助大模型在企业级和工业界运用中克服 “幻觉”,实行鉴于行业与场景的精准推演。
海致科技学问图谱与大模型交融运用平台正式公布
该产品目前已经在能源、金融、政务等领域的场景中举行部署和运用,力图打通通用人工智能进入 B 端和工业运用的 “最后一公里”。
日前,由中国电子技能标准化研究院、全国信标委等单位发起,海致科技全程参与的《学问图谱与大模型交融实践报告》也已经正式公布,上述成果以及部分运用案例也将为业界共享,推动更多市场主体和技能力量参与到通用人工智能的多技能交融之中。
大模型有 “幻觉” 学问图谱开药方
海致科技首席科学家郑纬民院士致辞
“当大模型从 C 端走向 B 端,它就像从玩具走向工具,而工具的精确性至关重要。写文章时查询爱因斯坦提出相对论的时间错了不太要紧,但是如果大模型对电网毛病的维修提出了错误的选项,结果可能是一场灾难。” 海致科技首席科学家郑纬民院士在接受记者采访时表示:” 短期来看,单纯依靠大模型自身的迭代,‘幻觉’问题难以解决,在这方面,学问图谱作为更加类脑的人工智能工具,其精确的学问推导才智就可以跟大模型构成非常好的相互补充,反过来,大模型的快速学习才智,对于学问图谱的学问生成也产生了很好的促进。“
大语言模型(LLM)所表现出的跨领域通用性、快速自主学习和自我改进的才智无疑是革命性的,也已经为人们广泛认知。但由于它的基本工作方式是分解文本中的词汇、句法结构、语义信息等,并捕捉它们之间的模式和概率分布,因此,它更倾向于鉴于统计规律生成回答,而非举行深入的逻辑推理或形成高级的认知才智。另外,它在生成文本时可能会受限于训练数据中存在的偏见和误导性信息,在某些情况下可能会产生不准确或不合理的回答。对于这种鉴于技能特征产生的瑕疵,人们将其形象比喻为 “大模型幻觉”。这种不期而遇的 “幻觉” 正是以大模型为代表的通用人工智能进入严谨 B 端运用的最后、也是最大的挑战。
在这一背景下,另一种被广泛运用的人工智能底子技能 —— 学问图谱,开始展现出它与大模型天然的互补才智。学问图谱作为公认 “类脑” 的学问表达方式,通过对语义网络举行建模,以结构化的形式描述客观世界中实体及关系,被广泛运用于学问推理。鉴于学问图谱的学问推理在离散符号表示的底子上,通过推理路径、逻辑规则等辅助手段,对推理过程举行解释,为实行 “可解释人工智能” 提供了重要途径。
由郑纬民院士担任首席科学家的海致科技,创业已有十年历程,是国内目前规模最大、运用客户范围最广的学问图谱和图算计公司。在金融、政务、能源、交通等领域拥有丰富而广阔的学问图谱运用经验,并推出了全球领先的国产分布式云原生图数据库 Atlas Graph,作为中国数据库代表入选 Gartner《全球图数据库管理系统市场指南》,填补了国产分布式图数据库的空白。
2022 年 10 月,郑纬民院士带领设立在海致科技的 “高性能图算计院士工作站” 的年轻科学家,开始跟踪全球各种大模型研发动态,致力于将学问图谱与大模型在技能上举行深度结合,并将其在一些金融、能源、政务企事业单位部署试用。瞄准 B 端行业客户长期积累起来的庞大结构化数据体系、算计分解运用体系,郑院士和海致创新性地将学问图谱作为中介桥梁,打通既有数据体系与大模型的连接,全面提升大模型在行业落地的可解释性、可交互性和可验证性。
” 人工智能发展的一个标尺是对人脑智能的学习。我们看来,学问图谱的严谨推演类似人类的左脑,而大模型快速学习的认知跟右脑的灵动颇为类似。” 郑纬民表示:“我们的产品就是要用一套学问映射、校验、优化的架构打通左右脑,推动通用人工智能深入企业级场景运用。”
实行大模型运用质量与效率的平衡
海致科技 CTO 杨娟公布学问图谱与大模型运用产品
“我们不生产大模型,我们致力于将大模型运用于生产。” 海致科技 CTO 杨娟博士介绍说,海致 Atlas LLM 大模型交融运用平台有三个非常独特的定位:一是在全过程实行了学问图谱与大模型的交互,有效克服大模型幻觉对工业运用的干扰;二是更好管理了客户已有的丰富的数据资产,将其与大模型成果统一整理,避免重复造轮子,使得算计更高效,运用更精确;三是能够帮助客户切换和灵活运用不同的开源大模型,实行更高性价比的场景运用。
海致科技副总裁瞿珂展示学问图谱与大模型运用产品
海致科技高级副总裁瞿珂为我们列举了该上述平台已经验证的一个工业场景:在工业制造设备运检领域中,复杂生产系统的毛病辨认因其毛病组合类型复杂、数据异构、以及要求反应速度很快,一直是人们对人工智能寄予厚望的领域。“过去我们通过利用学问图谱技能,可以将设备间关系以及关联设备量测信号构建成毛病学问特征子图来帮助机器自动实行毛病辨认,但是这一过程需要业务专家配合技能人员开展大量的实体构建和配置工作为先决条件,才能实行学问生成。但是今天我们可以通过大模型极大地提高这一学问抽取和交融的过程效率,一方面,通过大模型对毛病设备及关联量测值的快速提取,帮助学问图谱完成特征图的快速构建,提高效率;另一方面,也可以通过业务专家对大模型自动生成的特征图举行更为高效的校验,固化和校准毛病特征的经验学问,确保质量。”
企业 “大模型” 入门 “三步走”
在大模型时代,行业企业客户关心的另外一个重点,是未来的发展到底要用大模型彻底推翻旧的算计分解体系?还是鉴于已有算计分解体系的一次升级?海致科技立足客户业已建立的庞大算计分解运用和业务小模型,按照 “底子场景辨认 + 综合场景编排 + 场景固化公布” 的逻辑,实行了大模型运用的 “三步走”:
第一步:将客户已有算计分解和业务小模型的底子场景服务通过大模型微调,对场景语义举行标注辨认,并形成底子服务场景库。
第二步:鉴于多个底子服务的综合运用高阶场景,结合对应 Prompt 语义,运用大模型推理才智,对算计调用和算计逻辑举行智能化编排。
第三步:通过大模型编排,生成场景编排学问图谱,并鉴于学问图谱的可观测解释性和可交互操作性,实行对复杂场景大模型编排结果的观测和人工校验调优,形成对应语义的场景学问稳定固化和对外公布才智。
目前,海致已经实行了鉴于行业客户已有算计分解多才智的底子场景辨认,复杂场景编排和鉴于学问图谱的学问可观测、固化校验及公布才智,使大模型能够在已有算计分解学问和图谱固化场景两个 “准确性控制” 下,达成以大模型推理生成为核心的精准算计问答。