[发明专利]单个图的频繁子图挖掘方法及装置在审
申请号: | 202011254159.8 | 申请日: | 2020-11-11 |
公开(公告)号: | CN114490799A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 田群;戴永恒;李荣华;李艳斌;潘敏佳;刘学谦 | 申请(专利权)人: | 电科云(北京)科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京金咨知识产权代理有限公司 11612 | 代理人: | 秦景芳 |
地址: | 100041 北京市石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单个 频繁 挖掘 方法 装置 | ||
1.一种单个图的频繁子图挖掘方法,其特征在于,包括:
根据单个图的节点标签的字典排序结果生成所述单个图的规范邻接矩阵,并为所述单个图的规范邻接矩阵中的各图节点按行或列的顺序进行编号;
通过按图节点的编号顺序搜索所述单个图的规范邻接矩阵生成初始的次优规范邻接矩阵树,其中,该初始的次优规范邻接矩阵树的每个叶子的节点包括第一数量的边;所述第一数量为不小于一的整数;该初始的次优规范邻接矩阵树的根节点不包含所述单个图的图节点和边,所述根节点的孩子节点为频繁节点,所述频繁节点的孩子节点为频繁边;叶子的节点的CSP搜索空间为其所包含节点标签对应的图节点的编号的字典排序顺序组合;
在包含第一数量的边的叶子的第一节点为规范邻接矩阵且存在与其共有父节点的其他包含第一数量的边的叶子的第二节点的情况下,依据所述单个图的规范邻接矩阵对所述第一节点和所述第二节点做FFSM-Join运算,子图增长得到以所述第一节点和所述第二节点为父节点且包含第二数量的边的孩子节点;在包含第一数量的边的叶子的第三节点为规范邻接矩阵且为外矩阵的情况下,依据所述单个图的规范邻接矩阵对所述第三节点做FFSM-Extension运算,子图增长得到以所述第三节点为父节点且包含第二数量的边的孩子节点;其中,所述第二数量减去所述第一数量等于一;所述第三节点与所述第一节点或所述第二节点相同或不同;包含第二数量的边的孩子节点成为次优规范邻接矩阵树的叶子的节点;
以包含第二数量的边的叶子的节点作为候选子图,依据子图增长方式并根据候选子图的父节点和该父节点的CSP搜索空间构建相应候选子图的CSP搜索空间;
在当前候选子图的CSP搜索空间中图节点的编号的字典排序顺序组合的有效个数小于设定支持度阈值的情况下,将相应的候选子图标记为无效子图;
在根据所述单个图的规范邻接矩阵判断当前候选子图不是完成增长的子图的情况下,依据所述单个图的规范邻接矩阵并根据未被标记为无效子图的包含第二数量的边的节点进行子图增长,以更新次优规范邻接矩阵树的叶子节点,并根据完成子图增长的叶子节点输出所述单个图的频繁子图。
2.如权利要求1所述的单个图的频繁子图挖掘方法,其特征在于,通过按图节点的编号顺序搜索所述单个图的规范邻接矩阵生成初始的次优规范邻接矩阵树,包括:
通过按图节点的编号顺序搜索所述单个图的规范邻接矩阵初始化次优规范邻接矩阵树,得到初始的次优规范邻接矩阵树;其中,初始的次优规范邻接矩阵树的根节点为空值;所述第一数量等于一;所述频繁节点的CSP搜索空间为相应边的起始图节点的节点标签的编号和终点图节点标签的编号的字典排序顺序组合。
3.如权利要求1所述的单个图的频繁子图挖掘方法,其特征在于,
所述方法,还包括:
在包括第一数量的边的叶子的节点对应的次优邻接矩阵中图节点的编号不符合字典排序顺序的情况下,将相应的包括第一数量的边的叶子的节点标记为无效子图;
在包含第一数量的边的叶子的第三节点为规范邻接矩阵且为外矩阵的情况下,依据所述单个图的规范邻接矩阵对所述第三节点做FFSM-Extension运算,子图增长得到以所述第三节点为父节点且包含第二数量的边的孩子节点,包括:
在包含第一数量的边的叶子的第三节点为规范邻接矩阵、为外矩阵且未被标记为无效子图的情况下,依据所述单个图的规范邻接矩阵对所述第三节点做FFSM-Extension运算,子图增长得到以所述第三节点为父节点且包含第二数量的边的孩子节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电科云(北京)科技有限公司,未经电科云(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011254159.8/1.html,转载请声明来源钻瓜专利网。