[发明专利]一种基于三元组的RDF数据管理方法、装置及存储介质在审
申请号: | 201910389294.4 | 申请日: | 2019-05-10 |
公开(公告)号: | CN110096515A | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 陈仁海;燕国骅;关启明;冯志勇 | 申请(专利权)人: | 天津大学深圳研究院 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/23 |
代理公司: | 深圳市恒申知识产权事务所(普通合伙) 44312 | 代理人: | 袁文英 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三元组 存储 数据管理 物理存储地址 存储介质 主键 地址索引表 存储单元 组织形式 高并行 宾语 主语 保存 | ||
本发明实施例公开了一种基于三元组的RDF数据管理方法、装置及存储介质,将RDF数据中的各三元组通过调整主键类型的方式,生成三种类型的待存储三元组,三种类型的待存储三元组包括以主语为主键的三元组、以谓语为主键的三元组以及以宾语为主键的三元组;将各三元组的三种类型的待存储三元组,分别存储于SSD上物理存储地址不同的存储单元中;将各待存储三元组的主键与待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表。通过本发明的实施,将每个三元组数据按不同组织形式在SSD上存储三份,充分利用了SSD的高并行性,极大提高了在SSD上的数据管理性能。
技术领域
本发明涉及数据管理领域,尤其涉及一种基于三元组的RDF数据管理方法、装置及存储介质。
背景技术
大数据时代,信息呈现出高度非结构化和自由而丰富的关联性,许多知识库如微博、Facebook等的数据集通常以资源描述框架(RDF,Resource Description Framework)的形式进行存储。RDF数据实际上是由一些列的三元组数据组成的,其中每个三元组都是由三个元素组成:资源、属性和属性值,也称之为主语(Subject)、谓语(predicate)以及宾语(Object)。
近些年随着RDF的普及,RDF数据的数量已经大大增加,在许多RDF数据集中(例如Wikipedia)产生了数十亿个三元组。因此,如何有效地管理这些庞大的RDF数据成为一个巨大的挑战。目前,通常是将RDF数据在固态硬盘(SSD,Solid State Drive)进行存储,然而相关技术中在存储过程中,并未考虑到SSD内部的空间特性,例如channel,die,plane等内部信息,而是将RDF数据随机存储在SSD上的空闲存储单元,使得SSD的性能未得到充分发挥,在SSD上的数据管理性能较低。
发明内容
本发明实施例的主要目的在于提供一种基于三元组的RDF数据管理方法、装置及存储介质,至少能够解决相关技术中将RDF数据随机存储在SSD上的空闲存储单元,所导致的SSD性能未得到充分发挥,以及基于SSD的数据管理性能较低的问题。
为实现上述目的,本发明实施例第一方面提供了一种基于三元组的RDF数据管理方法,该方法包括:
将RDF数据中的各三元组通过调整主键类型的方式,生成三种类型的待存储三元组;所述三种类型的待存储三元组包括以主语为主键的三元组、以谓语为主键的三元组以及以宾语为主键的三元组;
将所述各三元组的所述三种类型的待存储三元组,分别存储于所述SSD上物理存储地址不同的存储单元中;
将各待存储三元组的主键与所述待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表。
为实现上述目的,本发明实施例第二方面提供了一种基于三元组的RDF数据管理装置,该装置包括:
生成模块,用于将RDF数据中的各三元组通过调整主键类型的方式,生成三种类型的待存储三元组;所述三种类型的待存储三元组包括以主语为主键的三元组、以谓语为主键的三元组以及以宾语为主键的三元组;
存储模块,用于将所述各三元组的所述三种类型的待存储三元组,分别存储于所述SSD上物理存储地址不同的存储单元中;
保存模块,用于将各待存储三元组的主键与所述待存储三元组所存储的物理存储地址的对应关系,保存至地址索引表。
为实现上述目的,本发明实施例第三方面提供了一种电子装置,该电子装置包括:处理器、存储器和通信总线;
所述通信总线用于实现所述处理器和存储器之间的连接通信;
所述处理器用于执行所述存储器中存储的一个或者多个程序,以实现上述任意一种基于三元组的RDF数据管理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学深圳研究院,未经天津大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910389294.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据查询方法和装置
- 下一篇:自定义的数据库交互的对话生成方法及系统