[发明专利]一种子图检索的方法、装置及电子设备在审
申请号: | 202210469593.0 | 申请日: | 2022-04-28 |
公开(公告)号: | CN114817647A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 刘寒;高歌;顾明 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903;G06N5/02 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 胡晓静 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种子 检索 方法 装置 电子设备 | ||
本发明公开了一种子图检索的方法、装置及电子设备,该方法包括:通过获取用户的检索需求;将检索需求按照预设的转换规则转化为子图模板和值约束规则;基于子图模板和值约束规则建立规则链条;将规则链条输入预设知识图谱进行检索得到符合规则链条的子图。本发明通过建立规则链条,直接从知识图谱中筛选与规则链条匹配的子图,降低了数据处理量,节省了大量的计算资源,同时计算速度更快,有效提高了检索效率。
技术领域
本发明涉及数据处理技术领域,具体涉及一种子图检索的方法、装置及电子设备。
背景技术
面向对象图数据是一类常用的数据表示与存储方法的统称,其数据由具有类型的节点与边构成,常见的包括RDF语义网数据,STEP、IFC等工业数据,以及Neo4j等图数据库的数据。目前,子图检索的规则表示通常由“子图模板”与“值约束规则”两部分组成:子图模板是表示检索目标子图中路径与结构的模板,通常是从某类根节点出发的具有分支的树状结构或有向无环图结构,用于在面向对象图数据中寻找与其匹配的子图;值约束规则表示对于每个与子图模板匹配的子图,其中的数值、字符串值等应当满足的约束条件与逻辑规则。
基于上述规则表示,现有对面向对象图数据的检索方法由“子图匹配”与“值约束检验”两个步骤组成,首先在全图数据中查找匹配子图,并针对每个子图逐一进行值约束规则的检验。当数据量较大时,现有的方法存在计算复杂、耗时长、效率低的问题。
发明内容
有鉴于此,本发明实施例提供了一种子图检索的方法,以解决当前数据检索过程计算复杂、耗时长、效率低的问题。
为达到上述目的,本发明提供如下技术方案:
本发明实施例提供了一种子图检索的方法,包括:
获取用户的检索需求;
将所述检索需求按照预设的转换规则转化为子图模板和值约束规则;
基于所述子图模板和值约束规则建立规则链条;
将所述规则链条输入预设知识图谱进行检索得到符合所述规则链条的子图。
可选的,所述将所述规则链条输入所述知识图谱进行检索得到符合所述规则链条的子图,包括:
将所述知识图谱与所述规则链条进行比对,得到能够通过所述规则链条的多个路径;
对所述多个路径进行回溯得到符合规则链条的多个子图。
可选的,所述对所述多个路径进行回溯得到符合规则链条的多个子图,包括:
从当前子图的最后一个节点开始沿路径进行回溯,判断所述多个路径上的每个节点是否连接有除路径上节点之外的分支节点;
若所述多个路径上的节点处连接有除路径上节点之外的分支节点,将所述分支节点删除,得到符合规则链条的多个子图。
可选的,所述基于所述子图模板和值约束规则建立规则链条,包括:
基于子图模板中的节点集和值约束规则建立多个规则段,所述规则段包括属性段、度量段和复合段;
根据每个度量段中节点集的元素属性将所述多个规则段依次进行连接,得到规则链条。
可选的,所述属性段是通过如下方式得到的:
获取子图模板中的各节点集的属性;
基于所述各节点集的属性建立各节点集之间的映射关系,得到属性段。
可选的,所述度量段是通过如下方式得到的:
获取每个节点集的度量值,所述度量值包括节点的类型和数量;
基于所述度量值和所述值约束规则对所述节点集进行筛选;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210469593.0/2.html,转载请声明来源钻瓜专利网。