[发明专利]一种基于多层划分框架的RDF分布式存储方法有效
申请号: | 201810803364.1 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109344259B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 刘均;王瑞杰;晋毓泽;张铎;魏笔凡;王萌;姚思雨;曾宏伟 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 划分 框架 rdf 分布式 存储 方法 | ||
1.一种基于多层划分框架的RDF分布式存储方法,其特征在于,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k-way分割,具体步骤如下:
Step1执行以下初始化操作:
101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定义RDF图为:G=(V,E),其中V={v|v∈Ts∪To},并且假设n=|V|表示RDF图中顶点的个数,m=|E|表示RDF图边的数量;
102)数据预处理:将RDF数据的N-Triple型数据集全部处理为图格式,为后续在RDF图上的算法运行做准备;
Step2通过MMA算法首先对RDF图的顶点移动进行优化:在MMA算法中设定ε∈[β,0.5),其中0<β<0.5,当模块度的增值大于ε,进行移动顶点;
Step3通过MSLM算法对RDF图进行粗糙化:基于模块度的MSLM算法将RDF图的规模进行压缩,达到粗糙化RDF图的目的,其具体的优化步骤如下:
301)RDF图中存在大量的属性节点,其入度都为1,将RDF图中所有的入度为1的顶点都等同于属性节点,即在算法运算过程,如果节点的入度为1,直接跳过进行下一个顶点的运算;
302)RDF图中存在着大量小社团,但是在模块度增加的情况下不断被吞并,所以设置浮动参数来调节保护小社团的存在;
Step4通过B_AP算法对RDF图进行k-way分割,实现分割的平衡性和最小边割的目标。
2.根据权利要求1所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step2中所述的MMA算法描述如下:
假设顶点v从c1移动到了c2,则对于c1和c2的模块度的变化如下:
式中E(c1)和E(c2)表示粗糙子图c1和c2中的边数,而和表示粗糙子图中c1和c2顶点v的邻居顶点;所以,模块度增值ΔQ的计算公式如下:
ΔQ=ΔQ1+ΔQ2 (7)。
3.根据权利要求2所述的基于多层划分框架的RDF分布式存储方法,其特征在于,Step3中所述的MSLM算法描述如下:
对于RDF图运行MSLM算法后,计算模块度值变量ΔQ',假设计算社团c1的某个顶点vi进行移动,其模块度变化计算公式如下:
式中,ωin(vi)表示由顶点vi入射社团c1的权重之和,∑tot表示入射社团c1的总权重,而ω(vi)表示顶点vi的总权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810803364.1/1.html,转载请声明来源钻瓜专利网。