[发明专利]基于VF2算法的SPARQL查询子图模式匹配方法在审
申请号: | 202211712045.2 | 申请日: | 2022-12-29 |
公开(公告)号: | CN115905295A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 王永恒;杨柳;李友梅;龙军;金雄男;陈庭轩;王子冬 | 申请(专利权)人: | 之江实验室;中南大学 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/532;G06F16/583;G06F16/58 |
代理公司: | 长沙七源专利代理事务所(普通合伙) 43214 | 代理人: | 张勇;邹琦 |
地址: | 310013 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 vf2 算法 sparql 查询 模式 匹配 方法 | ||
本发明提供了一种基于VF2算法的SPARQL查询子图模式匹配方法,包括以下步骤:将SPARQL查询语句以SPARQL查询图的形式呈现,根据链型识别规则以及星型识别规则将SPARQL查询图分为链型查询图以及星型查询图;建立VF2算法的基本匹配规则,并根据链型查询图的结构信息与语义信息建立链型匹配规则,根据星型查询图的结构信息与语义信息建立星型匹配规则;根据链型识别规则以及星型识别规则将RDF数据库中的RDF数据图分为链型数据图以及星型数据图;使用VF2算法分别将链型查询图与链型数据图以及星型查询图与星型数据图进行匹配,过滤得到匹配集合并输出结果。本发明提供的SPARQL查询子图模式匹配方法充分利用RDF数据图与SPARQL查询图的结构和语义信息从而提高查询效率。
技术领域
本发明涉及RDF数据查询技术领域,具体涉及一种基于VF2算法的SPARQL查询子图模式匹配方法。
背景技术
随着语义网的快速发展与应用,越来越多的应用领域利用RDF(ResourceDescription Framework)模型来描述大规模领域数据,如搜索引擎、道路交通、社交网络、生物信息学等领域。RDF模型主要采用s,p,o三元组形式描述一个数据的元数据,其中,s表示主词subject,p表示谓词predicate,o表示宾词object。例如:John,interest,UIDesign表示John喜欢UIDesign这门课程。一个三元组中的谓词p也可作为一条有向边,主词s与宾词o可作为节点,所以一个三元组也可以表示为因此,三元组之间通过共享的主词与宾词形成有向图,海量的RDF数据即可形成一个大规模有向图。目前这些应用领域的RDF数据集已达到数十亿级的规模,因此,面向大规模RDF领域数据的信息检索与信息匹配是目前亟需解决的关键问题之一。
急需一种能够面向大规模RDF领域数据的信息检索与信息匹配的基于VF2算法的SPARQL查询子图模式匹配方法以解决现有技术中存在的问题。
发明内容
本发明目的在于提供一种基于VF2算法的SPARQL查询子图模式匹配方法,具体技术方案如下:
基于VF2算法的SPARQL查询子图模式匹配方法,包括以下步骤:
S1:将SPARQL查询语句以SPARQL查询图的形式呈现,根据链型识别规则以及星型识别规则将SPARQL查询图分为链型查询图以及星型查询图;
S2:建立VF2算法的基本匹配规则,并根据链型查询图的结构信息与语义信息建立链型匹配规则,根据星型查询图的结构信息与语义信息建立星型匹配规则;
S3:根据链型识别规则以及星型识别规则将RDF数据库中的RDF数据图分为链型数据图以及星型数据图;使用VF2算法根据步骤S2中的基本匹配规则、链型匹配规则以及星型匹配规则分别将链型查询图与链型数据图以及星型查询图与星型数据图进行匹配,过滤得到匹配集合并输出结果。
优选的,所述链型识别规则为:当SPARQL查询图中仅具有链路的起点的节点、链路的终点的节点以及链路中的节点时,属于链型查询图;
所述星型识别规则为:当SPARQL查询图中具有核心点以及分支节点时,属于星型查询图。
优选的,所述步骤S2中的基本匹配规则包括前驱规则、后继规则、前驱1-hop规则、后继1-hop规则以及2-hop规则。
优选的,所述链型匹配规则的表达式如下:
星型匹配规则的表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;中南大学,未经之江实验室;中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211712045.2/2.html,转载请声明来源钻瓜专利网。