[发明专利]一种应用于频繁子图查询的频繁子图索引方法及装置在审
申请号: | 202111055107.2 | 申请日: | 2021-09-09 |
公开(公告)号: | CN113722551A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 毕立伟;孙喜民;周晶;李晓明;王帅;孙博 | 申请(专利权)人: | 国网电子商务有限公司;国网电商科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 尹秀 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 频繁 查询 索引 方法 装置 | ||
本发明公开了一种应用于频繁子图查询的频繁子图索引方法及装置,确定频繁子图集,将频繁子图集划范围各个图集块,为各个图集块建立外存索引;为频繁子图中的各个频繁子图建立内存索引,将各个内存索引存入内存中,将各个内存索引、外存索引和各个图集块存入外存中;在接收对目标图的查询请求的情况下,判断目标图是否为频繁子图;若是,在内存中确定所述目标图的目标内存索引,基于目标内存索引在外存中确定目标图所属目标图集块,获取目标图集块的目标外存索引;基于目标内存索引和目标外存索引为所述目标图建立目标连接。在对目标图进行查询过程中,基于内存索引和外存索引实现了对目标图的查询,不需要提取目标图的特征,提高了查询的速度。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种应用于频繁子图查询的频繁子图索引方法及装置。
背景技术
频繁子图:从动态演绎图序列中找到一组子图序列,使得其满足:(1)这些子图在动态图序列中的出现是频繁的;(2)这些子图的图序列随时间变化的情况保持一致。
目前,随着互联网的蓬勃发展,网络的规模在不断的扩大,在大型图数据处理过程中,传统的图模式挖掘算法随着支持度的减小,在时间或空间上代价逐渐增长,在一些特征提取方面也较为复杂,使得挖掘任务很难在合理的时间完成。
发明内容
有鉴于此,本发明提供了一种应用于频繁子图查询的频繁子图索引方法及装置,用于解决传统的图模式挖掘算法随着支持度的减小,在时间或空间上代价逐渐增长,在一些特征提取方面也较为复杂,使得挖掘任务很难在合理的时间完成的问题,具体方案如下:
一种应用于频繁子图查询的频繁子图索引方法,包括:
确定频繁子图集,将所述频繁子图集划分为各个图集块,为所述各个图集块建立外存索引;
为所述频繁子图中的各个频繁子图建立内存索引,将各个内存索引存入内存中,将所述外存索引和所述各个图集块存入外存中;
在接收对目标图的查询请求的情况下,判断所述目标图是否为频繁子图;
若是,在所述内存中确定所述目标图的目标内存索引,基于所述目标内存索引在所述外存中确定所述目标图所属目标图集块,获取所述目标图集块的目标外存索引;
基于所述目标内存索引和所述目标外存索引为所述目标图建立目标连接。
上述的方法,可选的,为所述频繁子图中的各个频繁子图建立内存索引,包括:
获取每个频繁子图的属性特征;
为每个频繁子图分配内存索引,将所述内存索引与对应的属性特征建立关联。
上述的方法,可选的,判断所述目标图是否为频繁子图,包括:
获取所述目标图中的各个点和各个边;
将所述各个点与预设基准频繁子图中的各个基准点进行比较,和,将所述各个边与所述预设基准频繁子图中的各个基准边进行比较;
判断所述各个点和所述各个边的比较结果是否满足预设的相似度阈值。
上述的方法,可选的,基于所述目标内存索引和所述目标外存索引为所述目标图建立目标连接,包括:
基于所述目标内存索引确定第一最短路径;
基于所述目标外存索引确定第二最短路径;
基于所述第一最短路径和所述第二最短路径确定所述目标链接。
上述的方法,可选的,还包括:
若否,为所述目标图在所述内存中建立内存索引,
检索所述内存索引在所述内存中的第三最短路径;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电子商务有限公司;国网电商科技有限公司,未经国网电子商务有限公司;国网电商科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111055107.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防漂浮物缠绕的流线形浮标
- 下一篇:一种无人机栖停装置及栖停方法