[发明专利]一种河湖健康知识图谱的构建方法在审
申请号: | 202111011671.4 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113918724A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 丛小飞;左翔;刘威风;赵杏杏;刘修恒 | 申请(专利权)人: | 南京中禹智慧水利研究院有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 何磊 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 健康 知识 图谱 构建 方法 | ||
1.一种河湖健康知识图谱的构建方法,其特征在于,步骤如下:
步骤1:制定河湖健康数据资源类别和相关的元数据范式文件;
步骤2:制定《水利数据目录服务规范》要求的可查询元数据项、可返回元数据项和详细展示,以及其它进行元数据管理所需要的规则配置文件;
步骤3:定义对河湖健康相关的本体概念,确定河湖健康本体模型的本体集并明确属性,根据属性挖掘以及建立本体之间的关系,进行河湖健康本体库模型的建模,旨在组建知识图谱的骨干网;
步骤4:在步骤3的基础上,通过主题挖掘、远程监督、事理因果关系提取的手段,从海量异构数据资源中抽取出更多的实体与关联关系,作为常识性内容补充到骨干关系图中;
步骤5:对抽取的实体三元组数据进行概念实体之间的相似度计算,采用基于共有属性的概念相似度计算算法和基于出入链集合的相似度计算算法进行综合计算,消除歧义和重复实体;
步骤6:建立河湖健康知识图谱的自适应更新机制。
2.根据权利要求1所述的一种河湖健康知识图谱的构建方法,其特征在于,所述步骤3具体包括:
步骤3-1:确定本体的专业领域和范畴,构建的本体模型主要覆盖于河湖健康领域,参考《水利对象基础数据库表结构及标识符》中的河湖健康对象,明确在河湖健康本体中包含的对象或者设施;
步骤3-2:考查复用现有河湖健康本体的可能性;
步骤3-3:列出河湖健康本体中的重要术语;
步骤3-4:定义河湖健康本体类和类的层次体系;
在河湖健康层次体系中,总共划分为六层,父节点为河湖,它的子节点有河湖对象和涉水对象;
在河湖对象内,分为自然和非自然两个大类:
在自然的范围内,根据其所在的地理范围,将自然细分为地下和地表两个类,而在上述的两个范围内再根据属性和各自的特点,各自分为输水通道和集储水单元这两个类;
在非自然的层次内,分设施和非设施两个范围,在设施这个范围内可以划分出独立设施和组合工程两个范围;在非设施这个范围内可以划分出行为主体和行为客体两个范围,在行为主体范围内,河湖管理相关单位和自然人两个本体概念;
步骤3-5:定义河湖健康本体属性,根据上述定义的河湖健康本体类,确定河湖健康本体类的属性;一个河湖健康本体的属性通常包括了两种,分别是内在属性和外在属性;
步骤3-6:定义河湖健康本体属性的分面,确定河湖健康本体属性的范围值和它的数据类型;
步骤3-7:构建河湖健康本体实例;基于以上步骤的准备工作,创建具体的河湖健康本体实例,其中的骨干结点与关联关系由河湖对象分类目录和单位部门目录构成。
3.根据权利要求1所述的一种河湖健康知识图谱的构建方法,其特征在于,所述步骤4具体包括:
(1)主题提取与关联,通过LDA等主题挖掘方式,提取出学术/公文、网络與情等非结构化档案数据资源中包含的管理主题;在此基础上,通过文本挖掘、共现分析等手段,将河湖健康管理主题图谱与河湖对象目录中的本体结构进行关联;
(2)事理提取与关联,通过事理因果分析等方式,提取出学术/公文档案中关于河湖健康在不同类别事件处置过程中的关键事件,以及事件间的影响关系;在此基础上,通过文本挖掘、共现分析的手段,将事理图谱与河湖健康对象目录中的本体结构进行关联;
(3)实体/关系词典,通过人工填报、文本挖掘等多种手段,提取出在河湖健康知识管理领域常见的专业词汇;
(4)OWL文件导入,通过OWL媒介,对河湖知识图谱概念层进行调整修正;
(5)多主题场景融合,通过表示学习等方式,基于关系层次、时序关系等,从河湖知识图谱中提取出特定管理主题下的场景图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中禹智慧水利研究院有限公司,未经南京中禹智慧水利研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011671.4/1.html,转载请声明来源钻瓜专利网。