[发明专利]一种基于知识图谱的档案管理模型构建方法及系统有效
申请号: | 202010600107.5 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111737471B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 雷洁;赵瑞雪;鲜国建;寇远涛;侯希闻;仲晓春;刘杉;许怡然;程思梦 | 申请(专利权)人: | 中国农业科学院农业信息研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/279;G06F40/30;G06N5/04 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 刘静 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 档案 管理 模型 构建 方法 系统 | ||
1.一种基于知识图谱的档案管理模型构建方法,其特征在于,包括:
获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;
基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型;
根据动态档案多维度关联模型,通过编辑工具、建模语言建立计算机可识别的档案知识图谱语义模型,利用档案知识对齐、知识消歧对档案自身知识进行知识融合,并与档案知识组织模型互相映射,通过知识推理过程对语义关联进行知识更新与替代。
2.根据权利要求1所述的基于知识图谱的档案管理模型构建方法,其特征在于,还包括:档案文本还与外部知识库建立关联,扩展档案的语义关系。
3.根据权利要求1所述的基于知识图谱的档案管理模型构建方法,其特征在于,所述获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系的步骤,包括:
分析档案文本的类型,根据不同类型档案文本的数据结构,采用不同的方法对档案文本进行解析;
在解析的基础上利用预设档案元数据架构以及档案知识层级构建识别档案文本中的最小知识单元;
利用预设实体识别方法及自然语言处理方法对最小知识单元进行抽取,所述最小知识单元为实体;
利用最小知识单元,建立与其他知识单元的语义联系。
4.根据权利要求3所述的基于知识图谱的档案管理模型构建方法,其特征在于,在解析的基础上利用预设实体识别方法及自然语言处理方法对档案文本中的最小知识单元进行抽取,所述最小知识单元为实体的步骤,包括:
在解析的基础上,进行档案资源知识层面的实体描述,通过预设档案元数据架构、档案知识层级架构及参考科技类相关字典,结合档案实体的词性特征要素,建立基于档案的实体抽取规则,通过深度学习模型进行档案实体抽取。
5.根据权利要求2所述的基于知识图谱的档案管理模型构建方法,其特征在于,基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型的步骤,包括:
利用本体编辑编辑工具,使用档案文本描述框架和本体表示语言,集成利用预设本体模型,结合档案语义描述体系,构建档案的知识图谱模型,形成档案文本之间以及档案文本与外部知识库的语义关联,建立动态档案多维度关联模型。
6.根据权利要求1所述的基于知识图谱的档案管理模型构建方法,其特征在于,档案自身知识,包括:档案活动中的科研人员、管理人员、科研项目、科研成果及档案资源中的实体和属性。
7.根据权利要求1所述的基于知识图谱的档案管理模型构建方法,其特征在于,知识推理过程,包括:基于符号的推理和基于统计的推理。
8.一种基于知识图谱的档案管理模型构建系统,其特征在于,包括:
最小知识单元识别模块,用于获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;
多维度关联模型构建模块,用于基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型;
知识融合模块,用于根据动态档案多维度关联模型,通过编辑工具、建模语言建立计算机可识别的档案知识图谱语义模型,利用档案知识对齐、知识消歧对档案自身知识进行知识融合,并与档案知识组织模型互相映射,通过知识推理过程对语义关联进行知识更新与替代。
9.一种终端,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7任一所述的基于知识图谱的档案管理模型构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7任一所述的基于知识图谱的档案管理模型构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业信息研究所,未经中国农业科学院农业信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010600107.5/1.html,转载请声明来源钻瓜专利网。