[发明专利]用户数据图谱化构建方法、系统、电子设备及存储介质在审
申请号: | 202211017274.2 | 申请日: | 2022-08-23 |
公开(公告)号: | CN115422367A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 张俊涛;孙淑玉;宫成龙;张健;肖新光 | 申请(专利权)人: | 北京安天网络安全技术有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31;G06F16/28;G06F16/25;G06F16/22 |
代理公司: | 北京科衡知识产权代理有限公司 11928 | 代理人: | 王淑静 |
地址: | 100195 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 数据 图谱 构建 方法 系统 电子设备 存储 介质 | ||
本发明实施例公开的用户数据图谱化构建方法、系统、电子设备及存储介质,涉及数据分析技术领域。所述方法包括:对用户数据进行分析,建立与所述用户数据对应的索引和字段属性结构,并针对每一个索引创建主键;其中,所述用户数据包含实体、以及实体与实体之间关系的数据;按照建立的所述索引和字段属性结构,导入所述用户数据;将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射,得到用户数据图谱。本发明便于提高用户数据图谱构建效率,适用于网络资产安全、企业关系、单位内部组织架构等各种数据分析场景中。
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户数据图谱化构建方法、系统、电子设备及存储介质。
背景技术
图数据库是一种数据存储引擎,它将顶点和边的基本图结构与持久化技术和遍历(查询)语言结合起来,以创建一个用于存储和快速检索高度关联的数据而优化的数据库。目前,已知图数据库包括Neo4j、Hugegraph等都支持csv文件格式等非结构化数据的导入。
但是,本申请的发明人在实现本发明创造的过程中发现:对于上述非结构化数据的导入,一般需要人工手动梳理导出的文件,区分出顶点(Vertex,表征实体)和边(Edge,表征实体之间的关系),并且需要按照图数据库的要求定义出CSV文件中的字段,工作量大,且容易导入错误,致使用户数据图谱构建效率较低。
发明内容
有鉴于此,本发明实施例提供一种用户数据图谱化构建方法、系统、电子设备及存储介质,便于提高用户数据图谱构建效率。
为达到上述发明目的,采用如下技术方案:
第一方面,本发明实施例提供一种用户数据图谱化构建方法,所述方法包括步骤:对用户数据进行分析,建立与所述用户数据对应的索引和字段属性结构,并针对每一个索引创建主键;其中,所述用户数据包含实体以及实体与实体之间关系的数据;
按照建立的所述索引和字段属性结构,导入所述用户数据;
将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射,得到用户数据图谱。
可选地,在对用户数据进行分析之前,所述方法还包括:获取用户数据;所述用户数据包含:非结构化数据;
所述方法还包括:在所述对用户数据进行分析时,判断所述非结构化数据中是否存在增量字段;
若不存在,则添加自增的长整型字段作为增量字段;
根据所述增量字段,确定增量导入的用户数据。
可选地,所述用户数据还包含:存储于标准数据库中的结构化数据;
所述方法还包括:从所述标准数据库中获取所述结构化数据;所述结构化数据以表的形式存储,每张表具有字段,每个字段携带有字段属性;
根据所述表、字段及字段属性,与图数据库中的预设索引及字段属性进行映射,得到所述结构化数据的图谱;所述预设索引以表的形式维护。
可选地,在将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射之前,所述方法还包括:配置所述图数据库中的映射关系;所述映射关系包含:索引及字段属性,所述索引用于表征实体,所述字段属性包含用于表征实体与实体之间关系的外键。
可选地,在配置所述图数据库中的映射关系之后,所述方法还包括:定期向所述图数据库中增量导入用户数据:
在增量导入用户数据时,根据所述映射关系,调用图数据库创建实体接口,给所述实体添加字段属性;
以及,调用图数据库创建实体关系接口,将表征实体与实体之间关系的字段属性添加到图数据库中。
可选地,在得到用户数据图谱之后,所述方法还包括:根据所述用户数据图谱展示或发现实体、实体与实体之间关系的拓扑结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安天网络安全技术有限公司,未经北京安天网络安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211017274.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置