[发明专利]一种基于多层划分框架的RDF分布式存储方法有效
申请号: | 201810803364.1 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109344259B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 刘均;王瑞杰;晋毓泽;张铎;魏笔凡;王萌;姚思雨;曾宏伟 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。 | ||
搜索关键词: | 一种 基于 多层 划分 框架 rdf 分布式 存储 方法 | ||
【主权项】:
1.一种基于多层划分框架的RDF分布式存储方法,其特征在于,该方法通过MMA算法和MSLM算法实现对RDF图的粗糙化,通过B_AP算法实现对RDF图的k‑way分割,具体步骤如下:Step1执行以下初始化操作:101)RDF图的初始化:设RDF三元组的主语集合为Ts,谓语集合为Tp,宾语集合为To,那么定于RDF图为:G=(V,E),其中V={v|v∈Ts∪To},并且假设n=|V|表示RDF图中顶点的个数,m=|E|表示RDF图边的数量;102)数据预处理:将RDF数据的N‑Triple型数据集全部处理为图格式,为后续在RDF图上的算法运行做准备;Step2通过MMA算法首先对RDF图的顶点移动进行优化:在MMA算法中设定ε∈[β,0.5),其中0<β<0.5,当模块度的增值大于ε,进行移动顶点;Step3通过MSLM算法对RDF图进行粗糙化:基于模块度的MSLM算法将RDF图的规模进行压缩,达到粗糙化RDF图的目的,其具体的优化步骤如下:301)RDF图中存在大量的属性节点,其入度都为1,所以本文认为将RDF图中所有的入度为1的顶点都等同于属性节点,即在算法运算过程,如果节点的入度为1,直接跳过进行下一个顶点的运算;302)RDF图中存在着大量小社团,但是在模块度增加的情况下不断被吞并,所以设置浮动参数来调节保护小社团的存在;Step4通过B_AP算法对RDF图进行k‑way分割,实现分割的平衡性和最小边割的目标。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810803364.1/,转载请声明来源钻瓜专利网。