[发明专利]一种基于双层索引结构的起源图查询方法有效
申请号: | 201510969332.5 | 申请日: | 2015-12-21 |
公开(公告)号: | CN105550332B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 许国艳;罗章璇;宋健;平萍 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双层 索引 结构 起源 查询 方法 | ||
1.一种基于双层索引结构的起源图查询方法,其特征在于,包含以下步骤:首先,面向起源图查询,提出一种双层索引结构;其次,设计基于词典表全局索引,表中记录起源数据与数据之间匹配关系以及起源图ID;然后,提出基于位图局部索引,依据起源图RDF查询方式,提出了满足Triple Pattern查询的索引和三种join查询方式,并且基于索引设计了相应的查询算法;
面向起源图查询的双层索引结构包括基于词典表全局索引和基于位图局部索引;全局索引查询起源图所存储的服务器节点,局部索引对全局索引查询到的服务器节点细化查询,进而查询到所需的起源数据;全局索引分布在云环境下每一个节点上,当用户请求到达时,只需参照本地服务器的全局索引结构即能得出所要查询起源图所在节点位置;局部索引是只建立在本地服务器所存储的起源数据的索引,每一个节点之间的局部索引并没有依赖关系;
基于词典表的全局索引及全局查询算法为:
首先给出词典表结构设计,在此基础上,完成基于全局索引的查询流程;
1)、词典表结构设计
根据数据起源特点,从两方面设计词典表HCPTable;首先,存储起源图名称和对应数据项;数据项就是起源所描述的数据,将一次工作流中的所有数据都对应一个起源图,粗粒度的描述起源与数据之间的关系;其次,存储起源图名称与对应ID;每一次工作流的执行则会产生一个数据起源图,起源ID则在存储过程中依据Hash(key)映射产生;全局索引中起源图ID为一致性哈希索引算法的输入项,根据起源ID可以快速计算出起源图所存储服务器节点;
2)、基于全局索引的查询流程
根据HCPTable中查询起源图ID从根节点开始遍历到叶子节点,根据叶子节点得出起源图存储服务器;全局索引查询流程如下:
(1)查找词典表得到起源图ID
(2)查找满足要求的子节点
(3)计算输出此节点编号。
2.根据权利要求1所述的基于双层索引结构的起源图查询方法,其特征在于,基于位图的局部索引及局部查询算法为:
起源图查询包含两部分:单个Triple Pattern查询和join查询;
(1)单个Triple Pattern查询
选择索引Is、Ip、Io、Isp、Ipo、Iso对主语、谓语、宾语、主语谓语、谓语宾语、主语宾语进行单个Triple Pattern的查询;
(2)join查询
选择索引Is'、Io'、Iso'用于处理主语共享变量、宾语共享变量和主语宾语共享变量进行join查询。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510969332.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:单一实体实例的挖掘方法和装置
- 下一篇:用电量查询方法、装置