[发明专利]一种面向属性图集的频繁近似子图挖掘方法在审
申请号: | 201510306230.5 | 申请日: | 2015-06-08 |
公开(公告)号: | CN104899292A | 公开(公告)日: | 2015-09-09 |
发明(设计)人: | 潘海为;高琳琳;韩启龙;战宇;翟霄;李文博 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于图挖掘技术领域,具体涉及一种面向属性图集的频繁近似子图挖掘方法。本发明包括:输入属性图集D;构造属性图集S;挖掘频繁近似顶点;子图扩展;计算扩展子图P’在属性图集D中的支持度;输出频繁近似子图集F。本发明提出一种面向属性图集的频繁近似子图挖掘方法,首先利用聚类算法将属性图集中连续数值型特征向量分割成离散特征向量,从而构建一个新的属性图集S,方便子图的搜索;然后在图近似匹配过程中采用具有较强容错能力的图编辑距离,符合现实世界中噪声和图失真普遍存在的现象,可以发现更多重要模式,具有更实际的应用前景。 | ||
搜索关键词: | 一种 面向 属性 频繁 近似 挖掘 方法 | ||
【主权项】:
一种面向属性图集的频繁近似子图挖掘方法,其特征在于,包括如下步骤:(1)输入属性图集D、支持度阈值σ、近似度阈值τ和代价函数d;(2)构造属性图集S:对属性图集D中顶点特征向量集和边特征向量集分别进行聚类,根据簇心特征向量构造一个新的图集S;之后在属性图集D和S上进行频繁近似子图搜索;(3)挖掘频繁近似顶点:根据属性图集D和S、两个阈值σ和τ、代价函数d,挖掘只包含一个顶点的频繁近似子图,将频繁近似顶点的三个相关信息加入到集合C,令频繁近似子图集F=C;(4)子图扩展:对于每个子图P∈C,找到子图P在属性图集S中的扩展边集ExtSet(P,S),对于每条扩展边eS∈ExtSet(P,S),将子图P和边eS连接得到扩展子图P’=PοeS;同时计算扩展子图P’的三个相关信息:子图P’的最小DFS编码Min(P’)、子图P’在图集S中的同构嵌入集Θ(P’,S)和子图P’在图集D中的近似嵌入集Ο(P’,D);(5)计算扩展子图P’在属性图集D中的支持度,若supp(P’,D)≥σ,则有F=F∪P’,并重复步骤(4),直至所有子图均被发现或者子图的支持度小于支持度阈值σ;(6)输出频繁近似子图集F。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510306230.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种异构数据源数据关联分析方法
- 下一篇:基于径向布局的多维层次可视化方法