[发明专利]一种基于键值对的RDF数据管理方法、装置及存储介质有效

专利信息
申请号: 201910389688.X 申请日: 2019-05-10
公开(公告)号: CN110134335B 公开(公告)日: 2022-08-12
发明(设计)人: 陈仁海;赵慧慧;燕国骅;关启明;冯志勇 申请(专利权)人: 天津大学深圳研究院
主分类号: G06F3/06 分类号: G06F3/06;G06F16/22;G06F16/24
代理公司: 深圳市恒申知识产权事务所(普通合伙) 44312 代理人: 袁文英
地址: 518000 广东省深圳市南*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 键值 rdf 数据管理 方法 装置 存储 介质
【说明书】:

发明实施例公开了一种基于键值对的RDF数据管理方法、装置及存储介质,针对RDF图上的每组相邻节点以及相邻节点之间的有向边,分别以各节点以及有向边为键构建键值对,然后分别将各键值对中的值分别存储在SSD上不同的存储单元中,并在其它存储单元中,对所有键值对中的键以及值的物理存储地址所组成的索引表进行存储,以及将键的存储地址保存于地址记录表中。通过本发明的实施,将SSD上的存储单元分为表区域和数据区域,通过表区域存储包括键与对应于键的值的物理存储地址的索引表,通过数据区域存储值,利于实现全面、可扩展的RDF数据管理,充分利用了SSD的高并行性,极大提高了在SSD上的数据管理性能。

技术领域

本发明涉及数据管理领域,尤其涉及一种基于键值对的RDF数据管理方法、装置及存储介质。

背景技术

大数据时代,信息呈现出高度非结构化和自由而丰富的关联性,许多知识库如微博、Facebook等的数据集通常以资源描述框架(RDF,Resource Description Framework)的形式进行存储。RDF数据实际上是由一些列的三元组数据组成的,其中每个三元组都是由三个元素组成:资源、属性和属性值,也称之为主语(Subject)、谓语(predicate)以及宾语(Object)。

近些年随着RDF的普及,RDF数据的数量已经大大增加,在许多RDF数据集中(例如Wikipedia)产生了数十亿个三元组。因此,如何有效地管理这些庞大的RDF数据成为一个巨大的挑战。目前,通常是将RDF数据在固态硬盘(SSD,Solid State Drive)进行存储,然而相关技术中在存储过程中,并未考虑到SSD内部的空间特性,例如channel,die,plane等内部信息,而是将RDF数据随机存储在SSD上的空闲存储单元,使得SSD的性能未得到充分发挥,在SSD上的数据管理性能较低。

发明内容

本发明实施例的主要目的在于提供一种基于键值对的RDF数据管理方法、装置及存储介质,至少能够解决相关技术中将RDF数据随机存储在SSD上的空闲存储单元,所导致的SSD性能未得到充分发挥,以及基于SSD的数据管理性能较低的问题。

为实现上述目的,本发明实施例第一方面提供了一种基于键值对的RDF数据管理方法,该方法包括:

基于待存储RDF数据创建RDF图;所述待存储RDF数据中所有三元组的主语和宾语对应于所述RDF图上的相邻的两个节点,谓语为所述主语和宾语所对应的所述相邻的两个节点之间的有向边;

基于所述RDF图上的各所述节点和所述有向边分别生成键值对;所述键值对包括第一键值对、第二键值对以及第三键值对,所述第一键值对以所述各节点为键,并以所述各节点向外延伸方向上的相邻节点,以及所述各节点与所述相邻节点之间的有向边所组成的集合为值,所述第二键值对以所述各节点为键,并以所述各节点向内引入方向上的相邻节点,以及所述各节点与所述相邻节点之间的有向边所组成的集合为值,所述第三键值对以所述相邻的两个节点之间的有向边为键,所述相邻的两个节点所组成的集合为值;

将各所述键值对中的键所对应的值分别存储于所述SSD上物理存储地址不同的存储单元中,然后在所述SSD上的其它存储单元中,对所有所述键值对中的键以及对应于所述键的值的物理存储地址所组成的索引表进行存储,并将所述键的物理存储地址保存于地址记录表中。

为实现上述目的,本发明实施例第二方面提供了一种基于键值对的RDF数据管理装置,该装置包括:

创建模块,用于基于待存储RDF数据创建RDF图;所述待存储RDF数据中所有三元组的主语和宾语对应于所述RDF图上的相邻的两个节点,谓语为所述主语和宾语所对应的所述相邻的两个节点之间的有向边;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学深圳研究院,未经天津大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910389688.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top