[发明专利]一种图数据生成方法、装置、服务器及存储介质在审
申请号: | 201911327964.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN113010744A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 吴鹏;柴永强;郝佳;王栋 | 申请(专利权)人: | 亚信科技(中国)有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王欢 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 生成 方法 装置 服务器 存储 介质 | ||
本申请实施例提供一种图数据生成方法、装置、服务器及存储介质,通过获取关联数据;读取关联数据的关联关系生成与关联关系相关的图特征抽取规则;并根据图特征抽取规则抽取关联数据的图特征信息(图特征信息包括顶点信息以及用于表征顶点之间关联关系的边信息);进而基于边信息分别生成顶点信息中每个顶点的图数据(图数据包括顶点的出度边信息和入度边信息)的方法,使得生成的图数据基于出度边信息和入度边信息能够表述图特征,进而基于本申请实施例生成的图数据可以降低图计算分析难度,提高图计算作业的性能。
技术领域
本发明涉及图计算技术领域,更具体地说,涉及一种图数据生成方法、装置、服务器及存储介质。
背景技术
存在潜在的关联性的数据可以称为关联数据,各种场景下的关联数据都能转成图来表示,我们可以利用图来进行数据挖掘和机器学习,比如识别出有影响力的人和信息、社区发现、寻找产品和广告的投放用户、给有依赖关系的复杂数据构建模型等等这些都可以使用图来完成。
图数据的定义来源于图计算。图计算是以图论为基础的对现实世界的一种图结构的抽象表达,以及在这种数据结构上的计算模式。图计算使用的这种数据结构可以称之为图数据。
目前图计算领域使用的图数据大多以关系型数据的形式按行存储,这种形式的图数据只能描述数据中每个字段的信息,而无法清晰地表述数据中的图特征(比如,图的顶点、边等等)。这种形式的图数据在进行图分析时无法直接根据图特征进行关联,增加了图计算分析的难度,同时由于需要对每一条图数据进行图分析,会大大影响图计算分析作业性能。
发明内容
有鉴于此,本申请提供一种图数据生成方法、装置、服务器及存储介质,以生成能够表述数据中图特征的图数据,进而降低图计算分析的难度,提高图计算分析作业的性能。技术方案如下:
一种图数据生成方法,包括:
获取关联数据;
读取所述关联数据的关联关系生成与所述关联关系相关的图特征抽取规则;
根据所述图特征抽取规则抽取所述关联数据的图特征信息,所述图特征信息包括顶点信息以及用于表征顶点之间关联关系的边信息;
基于所述边信息分别生成所述顶点信息中每个顶点的图数据,所述图数据包括顶点的出度边信息和入度边信息。
优选的,所述读取所述关联数据的关联关系生成与所述关联关系相关的图特征抽取规则,包括:
读取所述关联数据的关联关系;
获取预先设置的图特征抽取函数;
根据所述关联关系和所述图特征抽取函数生成与所述关联关系相关的图特征抽取规则。
优选的,所述根据所述图特征抽取规则抽取所述关联数据的图特征信息,包括:
根据所述图特征抽取规则中的顶点抽取规则确定所述关联数据中的各个顶点;
确定各个所述顶点中任意两两顶点是否满足所述图特征抽取规则中的边抽取规则;
若所述两两顶点满足所述边抽取规则,确定所述两两顶点之间存在关联关系且所述两两顶点之间存在一条边;
利用所述图特征抽取规则中的属性抽取规则,从所述关联数据中抽取所述顶点的属性和所述边的属性;所述顶点和所述顶点的属性构成所述图特征信息中的顶点信息,所述边和所述边的属性构成所述图特征信息中的边信息。
优选的,所述基于所述边信息分别生成所述顶点信息中每个顶点的图数据,包括:
选取所述顶点信息中未被选取过的顶点;
根据所述边信息确定与当前被选取的顶点存在关联关系的目标顶点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚信科技(中国)有限公司,未经亚信科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911327964.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电池剩余容量检测装置
- 下一篇:ADAM17在作为猪瘟病毒的受体中的应用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置