[发明专利]用户数据图谱化构建方法、系统、电子设备及存储介质在审

专利信息
申请号: 202211017274.2 申请日: 2022-08-23
公开(公告)号: CN115422367A 公开(公告)日: 2022-12-02
发明(设计)人: 张俊涛;孙淑玉;宫成龙;张健;肖新光 申请(专利权)人: 北京安天网络安全技术有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/31;G06F16/28;G06F16/25;G06F16/22
代理公司: 北京科衡知识产权代理有限公司 11928 代理人: 王淑静
地址: 100195 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户 数据 图谱 构建 方法 系统 电子设备 存储 介质
【说明书】:

发明实施例公开的用户数据图谱化构建方法、系统、电子设备及存储介质,涉及数据分析技术领域。所述方法包括:对用户数据进行分析,建立与所述用户数据对应的索引和字段属性结构,并针对每一个索引创建主键;其中,所述用户数据包含实体、以及实体与实体之间关系的数据;按照建立的所述索引和字段属性结构,导入所述用户数据;将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射,得到用户数据图谱。本发明便于提高用户数据图谱构建效率,适用于网络资产安全、企业关系、单位内部组织架构等各种数据分析场景中。

技术领域

本发明涉及数据分析技术领域,尤其涉及一种用户数据图谱化构建方法、系统、电子设备及存储介质。

背景技术

图数据库是一种数据存储引擎,它将顶点和边的基本图结构与持久化技术和遍历(查询)语言结合起来,以创建一个用于存储和快速检索高度关联的数据而优化的数据库。目前,已知图数据库包括Neo4j、Hugegraph等都支持csv文件格式等非结构化数据的导入。

但是,本申请的发明人在实现本发明创造的过程中发现:对于上述非结构化数据的导入,一般需要人工手动梳理导出的文件,区分出顶点(Vertex,表征实体)和边(Edge,表征实体之间的关系),并且需要按照图数据库的要求定义出CSV文件中的字段,工作量大,且容易导入错误,致使用户数据图谱构建效率较低。

发明内容

有鉴于此,本发明实施例提供一种用户数据图谱化构建方法、系统、电子设备及存储介质,便于提高用户数据图谱构建效率。

为达到上述发明目的,采用如下技术方案:

第一方面,本发明实施例提供一种用户数据图谱化构建方法,所述方法包括步骤:对用户数据进行分析,建立与所述用户数据对应的索引和字段属性结构,并针对每一个索引创建主键;其中,所述用户数据包含实体以及实体与实体之间关系的数据;

按照建立的所述索引和字段属性结构,导入所述用户数据;

将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射,得到用户数据图谱。

可选地,在对用户数据进行分析之前,所述方法还包括:获取用户数据;所述用户数据包含:非结构化数据;

所述方法还包括:在所述对用户数据进行分析时,判断所述非结构化数据中是否存在增量字段;

若不存在,则添加自增的长整型字段作为增量字段;

根据所述增量字段,确定增量导入的用户数据。

可选地,所述用户数据还包含:存储于标准数据库中的结构化数据;

所述方法还包括:从所述标准数据库中获取所述结构化数据;所述结构化数据以表的形式存储,每张表具有字段,每个字段携带有字段属性;

根据所述表、字段及字段属性,与图数据库中的预设索引及字段属性进行映射,得到所述结构化数据的图谱;所述预设索引以表的形式维护。

可选地,在将所述索引及字段属性与图数据库中的预设索引及字段属性进行映射之前,所述方法还包括:配置所述图数据库中的映射关系;所述映射关系包含:索引及字段属性,所述索引用于表征实体,所述字段属性包含用于表征实体与实体之间关系的外键。

可选地,在配置所述图数据库中的映射关系之后,所述方法还包括:定期向所述图数据库中增量导入用户数据:

在增量导入用户数据时,根据所述映射关系,调用图数据库创建实体接口,给所述实体添加字段属性;

以及,调用图数据库创建实体关系接口,将表征实体与实体之间关系的字段属性添加到图数据库中。

可选地,在得到用户数据图谱之后,所述方法还包括:根据所述用户数据图谱展示或发现实体、实体与实体之间关系的拓扑结构。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安天网络安全技术有限公司,未经北京安天网络安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211017274.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top