[发明专利]结合本体的分布式RDF存储与查询优化方法有效
申请号: | 201510003243.5 | 申请日: | 2015-01-06 |
公开(公告)号: | CN104462610B | 公开(公告)日: | 2018-02-06 |
发明(设计)人: | 汪璟玢;方知立;郑翠春 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 福州元创专利商标代理有限公司35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 本体 分布式 rdf 存储 查询 优化 方法 | ||
1.结合本体的分布式RDF存储与查询优化方法,其特征在于包括以下步骤:
步骤S1:采用IOMSQ算法对RDF数据文件进行分割存储;
步骤S2:对分割后的数据文件进行查询预处理;
步骤S3:对分割后的数据文件进行分布式查询;
步骤S4:进行数据更新,所述的数据更新包括新增数据,删除数据,修改数据;
所述步骤S1中的分割存储阶段包括以下步骤:
步骤S11:获取所述RDF本体文件中的所有的类,并创建以类名为文件名的文件;
步骤S12: 获取所述RDF数据文件中的所有的主语,再获取主语的Type属性所在的三元组与该主语所属的类;
步骤S13:把该主语的所有三元组存入到其主语所属的类的文件中,并用一个特殊标记表示一个主语的结束;
步骤S14:获取每个以类名为文件名的文件的大小,把文件名和对应的每个文件大小进行存储;
步骤S15:获取所述RDF数据文件中的所有的属性以及属性的定义域类,并建立属性与类的二维关系模型。
2.根据权利要求1所述的结合本体的分布式RDF存储与查询优化方法,其特征在于:所述步骤S2中的预查询处理阶段采用SPARQL查询语句,具体包括以下步骤:
步骤S21:按照主语的不同把查询语句分成N个查询语句块;
步骤S22:确定每个查询语句块要查询的以类名为文件名的文件集合;
步骤S23:确定语句块的查询顺序。
3.根据权利要求1所述的结合本体的分布式RDF存储与查询优化方法,其特征在于:所述步骤S3中的分布式查询阶段包括一个Map阶段和一个Reduce阶段;
所述的Map阶段查询一个语句块中的多个语句,把相同主语的所有三元组放在同一个分片进行查询,判断查询到的数据是否满足三元组模块,若满足则进入Reduce阶段;
所述的Reduce阶段把所有Map阶段的输出作为输入,再将其输出到以Reduce阶段的key为文件名的文件中。
4.根据权利要求1所述的结合本体的分布式RDF存储与查询优化方法,其特征在于:所述步骤S4中所述的新增数据具体包括以下步骤:
步骤S411:对于所有要新增的三元组,按照主语的不同分成多个三元组块;
步骤S412:对于每一个不同的三元组块,先看三元组块中是否有包含属性为type的三元组,如果有则需要添加到该三元组宾语对应的类文件集合Class1至Classt当中,进行步骤S414;若不包含属性为type的三元组则进行步骤S413;
步骤S413:对三元组块中包含的属性P1至Pn分别查找属性与类的二维关系模型,确定属性对应的类文件集合Class1至Classt;
步骤S414:查找类文件,如果类文件中的三元组存在主语与该三元组块的主语一致则添加到该主语的分片中,如果不存在主语与该三元组块一致,则在类文件尾部添加该三元组块并用特殊标记隔开。
5.根据权利要求1所述的结合本体的分布式RDF存储与查询优化方法,其特征在于:所述步骤S4中所述的删除数据具体包括以下步骤:
步骤S421:对于所有删除的三元组,按照主语的不同分成多个三元组块;
步骤S422:对于每一个不同的三元组块,先看三元组块中是否有包含属性为type的三元组,如果有则需要修改的三元组在该三元组宾语对应的类文件集合Class1至Classt当中,则进行步骤S424;若不包含属性为type的三元组则进行步骤S423;
步骤S423:对三元组块中包含的属性P1至Pn分别查找属性与类的二维关系模型,确定属性对应的类文件集合Class1至Classt;
步骤S424:查找类文件,删除类文件中与该三元组块相同的三元组块。
6.根据权利要求1所述的结合本体的分布式RDF存储与查询优化方法,其特征在于:所述步骤S4中所述的修改数据具体包括以下步骤:
步骤S431:对于所有修改前的三元组和修改后的三元组,按照主语的不同分成多个三元组块;
步骤S432:对于修改前的三元组中,每一个不同的三元组块,先看三元组块中是否有包含属性为type的三元组,如果有则需要修改的三元组在该三元组宾语对应的类文件集合Class1至Classt当中,则进行步骤S434;若不包含属性为type的三元组则进行步骤S433;
步骤S433:对三元组块中包含的属性P1至Pn分别查找属性与类的二维关系模型,确定属性对应的类文件集合Class1至Classt;
步骤S434:查找类文件,删除类文件中与该三元组块相同的三元组块;
步骤S435:对修改后的三元组做添加数据的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510003243.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业信息发布管理平台
- 下一篇:一种用户活跃度的挖掘方法及相关设备