[发明专利]一种新型存储系统的图冗余策略在审
申请号: | 202110307688.8 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113051106A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 陈仁海;李太俊;冯志勇;刘琤 | 申请(专利权)人: | 天津大学;天津电子信息职业技术学院 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F16/51 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 新型 存储系统 冗余 策略 | ||
本发明公开一种存储系统的RDF图冗余切割存储方法,在进行图切割划分时,把图切割顶点的关联顶点复制一份,放到两个flash页中冗余存储,以实现通过所述图切割顶点所在flash页能读取该关联顶点的数据。本发明的RDF图冗余切割存储方法的,通过对于与其它顶点关联度比较高的顶点在切割时把该顶点复制一份,放到两个页中,进行冗余存储,这样通过其它顶点读取该顶点时就不用到其它页中寻找它,也就是不再需要读取两个页的数据,从而提高读取效率。
技术领域
本发明涉及图存储技术领域,特别是涉及一种新型存储系统的图冗余策略,特别是一种存储系统的RDF图冗余切割存储方法。
背景技术
图存储技术研究图数据在SSD环境下的布局形式、划分方法、复制方法等一系列问题,它是图数据管理的前提与基石。图的存储方式直接决定了图数据的访问效率、图查询的效率。传统图存储系统是一种非关系型数据库,把数据节点和节点间的关系一起保存在数据库中。以顶点为中心的图存储系统在进行图划分时,是无组织的,只是粗粒度的将顶点分配到不同的分区中,没有深度分析不同顶点之间的关系以及读取顶点数据时的效率问题,也就不能有效的利用SSD的访问特性。
目前对图的划分方法已经在尽可能地充分利用SSD存储中整个页的存储资源,避免存储资源的浪费,但在对一个完整图划分时,不可避免地会将两个相关联的顶点切割后存放到不同的flash页中,SSD读取时的最小单位是页,所以如果需要读取存储在两个不同页中的相邻顶点时,为了得到两个顶点的内容需要读取它所在整个页,这样会成倍地增加读取时间。通过对大图的多次切割,这样的点就会越切割越多,如果程序中多次读取这些点的内容,读取效率就会越来越低。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种存储系统的RDF图冗余切割存储方法。
为实现本发明的目的所采用的技术方案是:
一种存储系统的RDF图冗余切割存储方法,在进行图切割划分时,把确定的图切割顶点的关联顶点复制一份,放到两个flash页中冗余存储,以实现通过所述图切割顶点所在flash页能读取该关联顶点的数据。
其中,所述关联点的选取步骤如下:
设置一个冗余阈值r',当待切割顶点的出度和入度之和r=r'时,将该待切割顶点作为关联点进行冗余存储,当rr'时,该待切割顶点仅存储一次,不作为关联顶点。
本发明的RDF图冗余切割存储方法的,通过对于与其它顶点关联度比较高的顶点在切割时把该顶点复制一份,放到两个页中,进行冗余存储,这样通过其它顶点读取该顶点时就不用到其它页中寻找它,也就是不再需要读取两个页的数据,从而提高读取效率。
附图说明
图1为本发明的存储系统的RDF图冗余切割存储方法的流程图;
图2为RDF示例图;
图3a-3d为传统RDF图切割方法示意图;
图4a-4d为冗余RDF图切割方法示意图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
由于现有技术中对图的切割是根据需求把图切割成不同小图,图切割时没有考虑把小图存储到SSD后,再重新读取时会不会产生效率问题,实际上,如果切割的顶点与其它的顶点关联度比较高,就会出现程序会经常读取切割顶点相邻的顶点,这样就需要读取两个顶点所在的两个页中的数据,导致读取时间成倍地增加,减缓了读取效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学;天津电子信息职业技术学院,未经天津大学;天津电子信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110307688.8/2.html,转载请声明来源钻瓜专利网。