[发明专利]子图抽取方法和装置有效
申请号: | 202210114037.1 | 申请日: | 2022-01-30 |
公开(公告)号: | CN114139022B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 周强;潘臻轩 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F9/50 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽取 方法 装置 | ||
本说明书实施例提供一种子图抽取方法和装置,方法包括:从指定数据源,获取当前时间周期相对于上一时间周期的增量数据;根据所述增量数据,得到关系网络图的增量图数据,其中包括若干新增节点;以各新增节点为根节点,对所述关系网络图执行子图抽取任务;在所述子图抽取任务执行过程中,一旦检测到子节点数目达到预设阈值的目标节点,根据该目标节点的子节点数目分配目标计算资源,利用所述目标计算资源执行以该目标节点为起点的子抽取任务。能够满足对计算规模和实时性两方面的需求。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及子图抽取方法和装置。
背景技术
图是一种由点和边构成的,包含多种属性的复杂数据结构。子图是图论的基本概念之一,其具体是指节点集和边集分别是某一图的节点集的子集和边集的子集的图。子图抽取,指从某一图中通过图计算找到业务感兴趣的子图。图计算将现实中的数据抽象为图数据结构并进行复杂计算。
现有技术中,在进行子图抽取时,因参与计算的图规模或子图的规模可能很大,会对图计算的实时性产生很大的挑战,无法满足对计算规模和实时性两方面的需求。
发明内容
本说明书一个或多个实施例描述了一种子图抽取方法和装置,能够满足对计算规模和实时性两方面的需求。
第一方面,提供了一种子图抽取方法,方法包括:
从指定数据源,获取当前时间周期相对于上一时间周期的增量数据;
根据所述增量数据,得到关系网络图的增量图数据,其中包括若干新增节点;
以各新增节点为根节点,对所述关系网络图执行子图抽取任务;在所述子图抽取任务执行过程中,一旦检测到子节点数目达到预设阈值的目标节点,根据该目标节点的子节点数目分配目标计算资源,利用所述目标计算资源执行以该目标节点为起点的子抽取任务。
在一种可能的实施方式中,所述关系网络图包括节点和连接边,所述增量图数据还包括新增连接边、新增节点属性信息、新增边属性信息中的一项或多项。
在一种可能的实施方式中,所述以各新增节点为根节点,对所述关系网络图执行子图抽取任务,包括:
从所述各新增节点中选择满足预设条件的第一新增节点作为根节点;
根据该根节点的子节点数目分配初始计算资源,利用所述初始计算资源对所述关系网络图执行以该根节点为起点的子图抽取任务。
进一步地,所述子图抽取任务用于从所述关系网络图中的根节点出发逐层抽取子节点构建子图;所述初始计算资源为与所述根节点的直接相连的子节点数目相关数目的并发资源。
进一步地,所述目标计算资源为与该目标节点的直接相连的子节点数目相关数目的并发资源。
在一种可能的实施方式中,所述方法还包括:
调用actor方法远程提交异步请求,所述异步请求用于请求执行所述子图抽取任务或所述子抽取任务;
接收返回的Object,根据Object获取所述子图抽取任务或所述子抽取任务的执行结果。
在一种可能的实施方式中,所述子图抽取任务抽取的子图的度至少为2。
在一种可能的实施方式中,所述子图抽取任务基于所述增量图数据和历史图数据而执行;
所述方法还包括:
根据所述增量图数据,更新所述历史图数据。
在一种可能的实施方式中,所述关系网络图为有向无环图。
在一种可能的实施方式中,所述子图抽取任务包括多轮迭代运算,所述子抽取任务在多轮迭代运算的任一轮迭代运算中触发。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210114037.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种甜菊醇衍生物及其制备方法和应用
- 下一篇:参数质量管理方法及相关装置