[发明专利]一种千亿级知识图库中的数据表示方法在审
申请号: | 201910514448.8 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110275969A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 吕志军;刘成军 | 申请(专利权)人: | 南京智慧图谱信息技术有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/583;G06F16/58;G06F16/587 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识转换 表示方式 全文索引 数据表示 数据格式 索引表示 知识图 数据库 存储格式 方法描述 数据依赖 映射转换 原始数据 知识转化 结构化 自定义 维度 索引 吞吐量 检索 关联 灵活 | ||
本发明公开了一种千亿级知识图库中的数据表示方法,包括图数据库中知识的表示方法,索引表示方法,知识转换表示方法;其中图数据库中知识的表示方法包括点的数据格式表示方式和边的数据格式表示方式,均包括两部分:数据的描述说明和数据的存储格式;索引表示方法由关联扩展索引、点的全文索引和边的全文索引组成;知识转换表示方法描述原始数据如何映射转换为点、边数据。本发明能够表达任意结构化的知识,能够灵活自定义任意维度的检索,知识转换过程没有数据依赖约束,可以提升知识转化计算的吞吐量。
技术领域
本发明涉及数据存储技术领域,尤其涉及一种千亿级知识图库中的数据表示方法。
背景技术
图数据库是基于图关系(Graph,非图像)模型建立的数据库,其中包含的数据往往有点数据和边数据。例如社交网络中的好友关系,其中每个人以点表示、好友关系以边表示。图库数据中存储的点和边往往需要能够支持动态结构的扩展:新增类型点的数据结构的扩展、已有类型点的数据结构的调整;新增类型边的数据结构的扩展、已有类型边的数据结构的调整。
在图数据库中,为了支撑千亿级知识的存储,需要要有一种数据表示方式,能够支撑灵活的数据定义、任意维度的关联扩展/属性检索/全文检索、支撑高吞吐量的知识转换过程,但目前还没有这种技术方案。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种千亿级知识图库中的数据表示方法,以解决现有技术的不足。
为实现上述目的,本发明提供了一种千亿级知识图库中的数据表示方法,包括图数据库中知识的表示方法,索引表示方法,知识转换表示方法;其中图数据库中知识的表示方法包括点的数据格式表示方式和边的数据格式表示方式,均包括两部分:数据的描述说明和数据的存储格式;索引表示方法由关联扩展索引、点的全文索引和边的全文索引组成;知识转换表示方法描述原始数据如何映射转换为点、边数据。
进一步地,所述点的数据格式表示方式中包括:
S11、点数据的描述说明,为描述点的自定义属性和自定义属性的检索方式,包含的内容有:点的类型、点的父类型、点的自定义属性、点的自定义属性类型、点的自定义属性的检索方式;其中点的自定义属性类型包括文本、整数、长整数、数字、日期时间、日期、时间、经纬度,点的自定义属性的检索方式包括无、分词检索、属性检索、全文检索;
S12、点数据的存储格式,点在图库中的实际存储内容,由两部分组成:固有属性和自定义属性;其中固有属性包括:点的唯一编号、点的数据源标识、点的溯源存储编号、点的类型、点的标签、点的生成时间;自定义属性是根据不同场景灵活定义的属性;其中,点的溯源存储编号由点的唯一编号与点的数据源标识组成。
进一步地,所述边的数据格式表示方式中包括:
S21、边数据的描述说明,描述边的自定义属性和自定义属性的检索方式,包含的内容有:边的类型、边的父类型、边的方向、A端点的类型、B端点的类型、边的自定义属性、边的自定义属性类型、边的自定义属性的检索方式;
S22、边数据的存储格式,边在图库中的实际存储内容由两部分组成:固有属性和自定义属性;其中固有属性包括:边的唯一编号、边的数据源标识、边的溯源存储编号、A端点的唯一编号、B端点的唯一编号、边的类型、边的标签、边的生成时间;其中,边的溯源存储编号由边的唯一编号与边的数据源标识组成。
进一步地,所述关联扩展索引、点的全文索引和边的全文索引具体包括:
S31、图关联扩展索引,用以存储图的关联扩展关系;由两部分组成:点的扩展关系和边的聚合列表;其中:
点的扩展关系包括:A端点的唯一编号、边的类型、边发生日期、B端点的唯一编号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京智慧图谱信息技术有限公司,未经南京智慧图谱信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910514448.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像数据处理方法和装置
- 下一篇:一种目标对象查找的方法及移动终端