[发明专利]知识图谱数据关系分离的混合存储方法及系统在审
申请号: | 201811640265.2 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109710618A | 公开(公告)日: | 2019-05-03 |
发明(设计)人: | 徐汕;梁炬;黄文锋;张晶亮;单酉;杨端;卫未 | 申请(专利权)人: | 北京航天云路有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 白明珠 |
地址: | 100039 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 存储 工业对象 图谱数据 关系型数据库 全文搜索引擎 数据库存储 查询方式 存储压力 对象实体 反向索引 关联关系 全文检索 设计过程 实体对象 数据冗余 复杂表 抽离 读写 维度 全局 搜索 关联 查询 | ||
本发明公开了一种知识图谱数据关系分离的混合存储方法及系统,包括以下步骤,存储工业对象数据;利用图数据库存储所述工业对象数据在维度上的关联关系;根据全局ID标识对象实体和全文搜索引擎建立全局ID的反向索引。本发明有益效果:节省复杂表的设计过程,避免关系型数据库中的数据冗余;将实体对象的属性从图数据库中抽离,减轻了图数据库的存储压力,提升了图数据库的读写效率;支持简单查询、全文检索和关联搜索等多种查询方式。
技术领域
本发明涉及工业互联网技术领域,具体来说,涉及一种知识图谱数据关系分离的混合存储方法及系统。
背景技术
工业数据所涉及的对象主要包括生产厂商,工业产品等。由于物料清单(Bill ofMaterial,BOM)的存在,不同的工业厂商和工业产品之间形成了巨大的关系网络,各厂商和产品在多个维度均有一定的关联性,如行业领域,产品类别,厂商地理位置和型号规格等,因此工业互联网平台在存储海量工业数据的同时,还需要存储工业对象之间存在的复杂的关系。
目前,互联网行业中使用的数据库可大致划分为关系型数据库与非关系型数据库,常用的关系型数据库有Mysql,Oracle,Microsoft Access等,非关系型数据库有MongoDB,Redis,HBase等;其中,关系型数据库能够很好地存储结构化数据并存储实体之间的关系,同时支持结构化查询并且支持事务,是目前互联网领域应用最为广泛的存储方式,然而,由于工业对象之间的关系较为复杂,在设计数据表时难度必然增大,数据表很难满足范式要求,从而造成不可避免的数据冗余。同时,关系型数据库在对海量数据进行读写时在效率上存在瓶颈,在存储行数较多的稀疏表时又存在资源占用问题。
基于列式存储的非关系型数据库在海量数据的读写上以及稀疏表的存储上有卓越的表现,然而基于列式存储的数据库不支持结构化查询,也缺少有效的多表联查的手段,因此列式存储难以存储实体之间的关系,图数据库也是一种非关系型数据库,目前常见的图数据库有Neo4j,Titan等,图数据库使用图数据结构存储数据,能够有效地存储对象实体之间的关系并且支持关联查询,然而图数据库在读写性能上有较大的局限性。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的上述技术问题,本发明提出一种知识图谱数据关系分离的混合存储方法及系统,能够避免了关系型数据库中的数据冗余的问题。
为实现上述技术目的,本发明的技术方案是这样实现的:
一种知识图谱数据关系分离的混合存储方法,包括以下步骤,
存储工业对象数据;
利用图数据库存储所述工业对象数据在维度数据上的关联关系;
根据全局ID标识对象实体和全文搜索引擎建立全局ID的反向索引。
进一步地,所述存储工业对象数据之前包括:将所述工业对象数据依次经过数据抓取和数据清洗后申请全局ID;获取全局ID将其同步存储至各个存储介质中。
进一步地,在所述图数据库创建一个节点,判断维度数据在图数据库中是否存在,若存在,直接将新节点与相应的维度节点建立关系;反之,创建相应的维度节点并建立关系。
进一步地,所述存储工业对象数据利用列式数据库存储。
进一步地,所述工业对象数据包括实体数据、关系数据和索引数据。
本发明的另一方面,提供一种知识图谱数据关系分离的混合存储系统,其特征在于,包括:
第一存储模块,用于存储工业对象数据;
第二存储模块,用于利用图数据库存储所述工业对象数据在某些维度上的关联关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天云路有限公司,未经北京航天云路有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811640265.2/2.html,转载请声明来源钻瓜专利网。