[发明专利]一种面向属性图集的频繁近似子图挖掘方法在审
申请号: | 201510306230.5 | 申请日: | 2015-06-08 |
公开(公告)号: | CN104899292A | 公开(公告)日: | 2015-09-09 |
发明(设计)人: | 潘海为;高琳琳;韩启龙;战宇;翟霄;李文博 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 属性 频繁 近似 挖掘 方法 | ||
1.一种面向属性图集的频繁近似子图挖掘方法,其特征在于,包括如下步骤:
(1)输入属性图集D、支持度阈值σ、近似度阈值τ和代价函数d;
(2)构造属性图集S:对属性图集D中顶点特征向量集和边特征向量集分别进行聚类,根据簇心特征向量构造一个新的图集S;之后在属性图集D和S上进行频繁近似子图搜索;
(3)挖掘频繁近似顶点:根据属性图集D和S、两个阈值σ和τ、代价函数d,挖掘只包含一个顶点的频繁近似子图,将频繁近似顶点的三个相关信息加入到集合C,令频繁近似子图集F=C;
(4)子图扩展:对于每个子图P∈C,找到子图P在属性图集S中的扩展边集ExtSet(P,S),对于每条扩展边eS∈ExtSet(P,S),将子图P和边eS连接得到扩展子图P’=PοeS;同时计算扩展子图P’的三个相关信息:子图P’的最小DFS编码Min(P’)、子图P’在图集S中的同构嵌入集Θ(P’,S)和子图P’在图集D中的近似嵌入集Ο(P’,D);
(5)计算扩展子图P’在属性图集D中的支持度,若supp(P’,D)≥σ,则有F=F∪P’,并重复步骤(4),直至所有子图均被发现或者子图的支持度小于支持度阈值σ;
(6)输出频繁近似子图集F。
2.根据权利要求1所述的一种面向属性图集的频繁近似子图挖掘方法,其特征在于:所述代价函数d,设<Qi,Qj>是图编辑路径中的中一个编辑操作,其中pk是Qi的第k个特征值,qk是Qj的第k个特征值,d(<Qi,Qj>)表示编辑操作<Qi,Qj>的代价函数,则有:
3.根据权利要求1所述的一种面向属性图集的频繁近似子图挖掘方法,其特征在于:所述的近似嵌入集,给定图P,图G,图gi,其中图gi是图G的一个子图,若图P和图gi是τ-近似图,则称图gi是图P在图G中的一个近似嵌入;用ο(P,G)表示图P在图G中的近似嵌入集,则有ο(P,G)={gi|gi是图G的子图,图P和图gi是τ-近似图};用Ο(P,D)表示图P在图集D中的所有近似嵌入,则有Ο(P,D)=∪G∈DΟ(P,G)。
4.根据权利要求3所述的一种面向属性图集的频繁近似子图挖掘方法,其特征在于:所述的τ-近似图,给定两个图Gi、Gj和近似度阈值τ,如果Gi和Gj的图编辑距离不大于1-τ,即dism(Gi,Gj)≤1-τ,则称图Gi和图Gj是τ-近似图。
5.根据权利要求1所述的一种面向属性图集的频繁近似子图挖掘方法,其特征在于:在所述的属性图集D和S上进行频繁近似子图搜索,以属性图集S中的图为基准进行子图搜索, 同时根据属性图集D、两个阈值σ和τ、代价函数d来判断子图是否为频繁近似子图,图GS∈S,存在子图gS∈GS,若在属性图集D中存在包含子图gD的图GD,使得gD和gS是τ-相似图,且图GD的个数不小于即supp(gS,D)≥σ,则称子图gS是频繁近似子图;接着在图集S中查找子图gS的所有扩展边,根据每条扩展边对子图gS进行扩展得到新的扩展子图,并判断扩展子图是否为频繁近似子图;按照上述过程遍历属性图集S中的所有子图,同时根据属性图集D、两个阈值σ和τ、代价函数d找出所有频繁近似子图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510306230.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种异构数据源数据关联分析方法
- 下一篇:基于径向布局的多维层次可视化方法