抽取
蚂蚁集团、浙江大学联合发布开源大模型知识抽取框架OneKE
近日,由蚂蚁集团和浙江大学联合研发的大模型知识抽取框架OneKE宣布开源,并且捐赠给OpenKG开放知识图谱社区。知识图谱是实现大模型可信可控的关键技术之一,知识抽取可助力构建领域知识图谱。OneKE致力于帮助研究人员和开发者更好地处理信息抽取、文本数据结构化、知识图谱构建等问题。比如,通过OneKE抽取风险事件、人物实体、机构实体等可以清晰呈现事件脉络、事件发展趋势和实体之间关联,构建好的图谱可以帮助大模型实现跨实体、跨文档的复杂推理 。OneKE支持中英双语,支持OpenSPG及DeepKE开源框架,可开箱即用
一文详解BERT模型实现NER命名实体抽取
在自然语言处理和知识图谱中,实体抽取、NER是一个基本任务,也是产业化应用NLP 和知识图谱的关键技术之一。
达观智能文档审阅系统,推动证券非结构化文档处理提质提效
达观智能审阅系统,实现相关场景非结构化文档的识别解析、智能审核及与业务对接等,并通过平台化建设提供一定的可拓展性和泛化能力。
百分点认知智能实验室:基于不完全标注样本集的信息抽取实践
编者按信息抽取是从文本数据中抽取特定信息的一种技术,命名实体识别(Named Entity Recognition, NER)是信息抽取的基础任务之一,其目标是抽取文本中具有基本语义的实体单元,在知识图谱构建、信息抽取、信息检索、机器翻译、智能问答等系统中都有广泛应用。基于监督学习的NER系统通常需要大规模的细粒度、高精度标注数据集,一旦数据标注质量下降,模型的表现也会急剧下降。利用不完全标注的数据进行NER系统的建立,越来越受到专家学者们的关注。第九届国际自然语言处理与中文计算会议(NLPCC 2020)针对此业
- 1