[发明专利]一种基于领域知识图谱的水务数据智能发现方法在审

专利信息
申请号: 202110391919.8 申请日: 2021-04-13
公开(公告)号: CN113094514A 公开(公告)日: 2021-07-09
发明(设计)人: 闫健卓;秦昀 申请(专利权)人: 北京工业大学
主分类号: G06F16/36 分类号: G06F16/36;G06F40/284;G06F40/30;G06N5/04
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 领域 知识 图谱 水务 数据 智能 发现 方法
【说明书】:

发明公开了一种基于领域知识图谱的水务数据智能发现方法,该方法包括如下步骤:构建水务信息知识图谱,该知识图谱中包含了领域的概念、实体、实体与实体之间的信息;总结领域数据的特征信息,包括时间信息、空间信息、数据类型等特征。针对水务数据集的特征信息,利用水务知识图谱中的概念或者实体对领域数据进行标注。利用Jena并制定语义推理规则对水务知识图谱进行语义推理以发现原来知识图谱中没有的领域知识。利用排序技术对数据进行排序,得到用户想要的数据。本发明面对海量、多类型的水务数据,总结了一套完整的数据发现推荐方法,可以帮助专业人员更准确地发现自己想要的信息。

技术领域

本发明属于知识图谱构建及应用领域,涉及一种基于领域知识图谱的水务数据智能发现方法。

背景技术

随着水利信息的发展,通过先进的采集设备和技术,我们采集到了大量的水环境实时数据。同时,网络上由用户产生的数据以及一些开放链接数据都在不断产生。但是,专业人员和用户想要获取自己需要的数据时,通过关键词的搜索并不能得到想要的结果。知识图谱是一种大规模的语义网络。2012年谷歌提出知识图谱的概念是为了提高其搜索质量。对于现在知识图谱的构建,已经出现了许多通用知识图谱和领域知识图谱,典型的有百度的“知心”、搜狗的“知立方”、SciKG、LikedMDB等。领域知识图谱的深度还有待进一步深入。对于知识图谱相关的应用,2016年李威蓉等人构建了地理空间数据来源本体来提高地理空间数据的检索质量。2015年冯钧等以《水利公文主题词表》构建的本体为基础对水利信息进行检索。但是,该研究中构建的知识库信息缺乏,并不能很好的涵盖这个领域,进而达到很好的检索效果。

发明内容

有鉴于上述现有的不足,本发明的目的在于提供一种基于领域知识图谱的水务数据智能发现方法构建方法。本方法首先构建水务知识图谱,然后利用知识图谱对领域数据做标注,最后基于知识图谱对用户输入的关键词进行解析进而得到排序后的数据,提高了数据的发现质量。

为了解决上述问题,本发明采用如下的技术方案:一种基于领域知识图谱的水务数据智能发现方法包括一下步骤:

步骤1:利用现有百科非结构化数据,数据库中的结构化数据和文本中的结构化数据构建知识图谱。

步骤2:采集水务相关数据,并利用知识图谱对数据做标注。

步骤3:对数据进行检索。首先对用户数据的关键词进行识别,然后利用Jena解析知识图谱发现其关联信息进而得到用户想要的数据,最后对数据进行排序。

进一步的,本发明步骤1所述的构建知识图谱的方法,其步骤具体包括:

步骤1-1:利用TFIDF算法从专业文献中抽取领域的重要术语,基于这些术语利用参照法(标杆对照、业务适配、增补裁剪)梳理出水务知识图谱的实体类型。

步骤1-2:利用参照法梳理出水务知识图谱的实体关系类型。

步骤1-3:利用现有的数据库中的结构化数据库中的数据填充知识图谱的实例信息。如果出现新的实体类型,则返回步骤1,添加新的实体类型。

步骤1-4:抽取现有知识库CN-DBpedia中的实体信息来丰富水务知识图谱中的属性信息。

步骤1-5:利用深度学习的方法来抽取水务实体之间的关系,丰富知识图谱的关系类型。如果有出现新的实体关系类型,则回到步骤2,添加新的实体关系类型。

进一步的,本发明步骤2所述的数据标注方法,其步骤具体包括:

步骤2-1:在网上或者专业数据库中收集水务领域的数据集,记录它的元数据。同时,要分析这些数据集的特征,时间特征、空间特征和来源特征等。

步骤2-2:利用构建的水务知识图谱中的概念或者实例去标注步骤2-1中收集的水务数据的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110391919.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top