[发明专利]一种数据管理方法和装置在审
申请号: | 202010975369.X | 申请日: | 2020-09-16 |
公开(公告)号: | CN112100316A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 李仕毅;徐旭军;张树民 | 申请(专利权)人: | 北京天空卫士网络安全技术有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;张效荣 |
地址: | 100176 北京市北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据管理 方法 装置 | ||
本发明公开了一种数据管理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取非结构化数据,其中,非结构化数据包括至少一层嵌套关系以及嵌套关系对应的父数据对象和子数据对象;分别为父数据对象和子数据对象生成对应的包括特征信息的结构图;根据嵌套关系,构建父数据对象对应的结构图和子数据对象对应的结构图之间的逻辑关系;基于结构图和逻辑关系,对非结构化数据进行管理。该实施方式有效地提高了非结构化数据管理效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据管理方法和装置。
背景技术
在这个互联网数据多样化的时代,有效管理数据是使用数据的基础。比如,将非结构化的数据进行结构化管理,以使这些数据能够更好地在信息搜索、数据安全维护等场景中发挥比较好地作用。
目前,主要通过数据库关系表将非结构化数据进行结构化管理,即根据数据库关系表的配置或者结构,将非结构化数据对应填充到相应地关系表中,以得到结构化的数据。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
由于需要为非结构化数据配置关系表或者为非结构化数据查找相应的关系表,现有的这种对非结构化数据进行结构化管理的方式,操作比较复杂,降低了数据管理效率。
发明内容
有鉴于此,本发明实施例提供一种数据管理方法和装置,能够基于非结构化数据本身得到包括特征信息的结构图以及父数据对象对应的结构图和子数据对象的结构图之间的逻辑关系,实现对非结构化数据进行更加直观的结构化管理,通过这种结构图和逻辑关系是基于非结构化数据本身得到的,而无需为非结构化数据构建或查找关系复杂的关系表,有效地提高了非结构化数据管理效率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据管理方法,包括:
获取非结构化数据,其中,所述非结构化数据包括至少一层嵌套关系以及所述嵌套关系对应的父数据对象和子数据对象;
分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图;
根据所述嵌套关系,构建所述父数据对象对应的结构图和所述子数据对象对应的结构图之间的逻辑关系;
基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理。
可选地,分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图,包括:
当所述父数据对象或所述子数据对象作为当前数据对象时,
为所述当前数据对象生成对应的容器节点;
解析所述当前数据对象包括的特征信息,并为所述特征信息构建对应的信息节点;
构建所述信息节点与所述容器节点之间的连接关系,得到所述包括特征信息的结构图。
可选地,分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图,包括:
为所述当前数据对象生成对应的容器节点以及与所述容器节点存在连接关系的多个信息节点,其中,每一个所述信息节点对应一种信息类别;
根据所述信息节点对应的信息类别,利用所述当前数据对象包括的特征信息填充所述信息节点,得到所述包括特征信息的结构图。
可选地,
所述多个信息节点,包括:格式信息节点、类型信息节点、文件基本属性信息节点、文件元信息节点、文本内容信息节点、原始内容信息节点、文档属性信息节点、标签信息节点中的任意多个。
可选地,基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天空卫士网络安全技术有限公司,未经北京天空卫士网络安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010975369.X/2.html,转载请声明来源钻瓜专利网。