[发明专利]一种基于图摘要的图模式挖掘方法在审
申请号: | 201810786032.7 | 申请日: | 2018-07-17 |
公开(公告)号: | CN109101570A | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | 何洁月;王鹤 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式挖掘 算法 候选集合 输入图 挖掘结果 原始图 支持度 拆解 筛选 引入 | ||
1.一种基于图摘要的图模式挖掘算法,其特征在于,对于输入图G,依次包括以下顺序执行的步骤:
步骤1、对于节点集合V={v1,v2,…,vn},依次计算每个节点的密度ρ,将节点和节点密度保存在集合F中,
步骤2、对集合F按照密度ρ由大到小进行排序;
步骤3、每次从F中的取一个节点v,寻找它的所有2步长节点u,依次根据重构误差公式C计算v和2步长节点的重构误差C;
步骤4、选择重构误差C≥θ且最大的节点,与选定的节点v进行合并,更新F,转至步骤3;
步骤5、如果所有2步长节点的重构误差均不满足C≥θ,则将节点移出F集合,若移出后集合F为空,则结束摘要阶段,保存摘要阶段结果;
步骤6、将摘要阶段生成的每一个子图,作为一个批次输入,初始化一个具有单边的字典P,P中存储输入的子图的每一条边;
步骤7、对于下一个输入的图,如果边e出现过,则对其进行扩增1条边,这条边需要时之前出现过的边;
步骤8、对于每一个模式,计算每一个模式的H值,进行排序,取前S个模式,S根据实际需求而定,H计算方法如下:
H(pi)=(|Epi|-1)×(Fpi-1);
其中Epi指这个模式中边的条数,Fpi指这个模式出现的次数。
2.根据权利要求1所述的基于图摘要的图模式挖掘算法,其特征在于,所述步骤1)中,密度ρ的计算方法如下:
ρ=ρ1+αρ2;
其中ρ1、ρ2、α(0≤α≤1)分别为一步长密度、二步长密度和系数。
3.根据权利要求2所述的基于图摘要的图模式挖掘算法,其特征在于,所述步骤3)中重构误差C公式如下:
其中cu、cv分别是两个节点的相临节点,cw是两个节点集u、v相邻的公共节点数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810786032.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于软件的发布系统及方法
- 下一篇:ETL设计过程的处理方法、装置和设备