[发明专利]一种单图中近似频繁图挖掘的方法、装置、设备、介质和系统有效
申请号: | 201810426034.5 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108595686B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 林欣;窦建凯;吴永成 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 200333 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 单图中 近似 频繁 挖掘 方法 装置 设备 介质 系统 | ||
1.一种单图中近似频繁图挖掘的方法,其特征在于,所述方法包括:
根据给定的单图的大小、给定的相似度和给定的频繁程度,计算所述单图的频繁子图的大小上限,所述频繁子图的大小上限为其中,|G|为所述单图的大小,s为所述相似度,f为所述频繁程度;
根据所述频繁子图的大小上限,遍历所述单图,搜索所述单图的所有子图,所述子图的大小小于等于所述频繁子图的大小上限;
对所述单图的每个所述子图,搜索所述子图的所有相似子图,包括:根据所述子图的大小和所述相似度,计算所述子图与所述相似子图的最大编辑距离,所述最大编辑距离为GED=(1-s)*|g|,其中|g|为所述子图的大小,s为所述相似度;
根据所述最大编辑距离,对所述单图的每个所述子图,搜索所述子图的所有所述相似子图,所述相似子图通过对所述子图进行编辑操作而获得,所述子图与所述相似子图的编辑距离小于等于所述最大编辑距离;
对所述子图的每个所述相似子图,在所述单图中进行匹配,搜索所述相似子图的所有匹配图,所述匹配图指相似子图g′在单图G中的同构图;
将所述子图的所有所述相似子图的所述匹配图组成匹配图集合,计算所述匹配图集合中最大独立集的所述匹配图的数量;
比较所述最大独立集的所述匹配图的数量和所述频繁程度,如果所述最大独立集的所述匹配图的数量大于等于所述频繁程度,输出所述子图。
2.根据权利要求1所述的方法,其特征在于,根据所述频繁子图的大小上限,遍历所述单图,搜索所述单图的所有子图,所述子图的大小小于等于所述频繁子图的大小上限包括:
采用广度优先搜索算法遍历所述单图,搜索所述单图的所有所述子图;
根据所述频繁子图的大小上限,删除大小大于所述频繁子图的大小上限的所述子图。
3.根据权利要求1所述的方法,其特征在于,所述编辑操作由删除操作和修改操作组成。
4.根据权利要求3所述的方法,其特征在于,将所述删除操作造成的所述编辑距离由所述最大编辑距离向0递减;将所述修改操作造成的所述编辑距离由0向所述最大编辑距离递增;在所述删除操作造成的所述编辑距离为GED-K时,所述修改操作造成的所述编辑距离对应为0,1,2…K,其中K为自然数。
5.根据权利要求3所述的方法,其特征在于,对所述子图进行所述修改操作时,如果某个点被删除后得到的所述相似子图与所述子图的所述编辑距离小于等于所述最大编辑距离,则不同时对所述点和与所述点相连的全部边进行所述修改操作。
6.根据权利要求1所述的方法,其特征在于,对所述子图的每个所述相似子图,在所述单图中进行匹配,搜索所述相似子图的所有匹配图包括:
搜索所述子图的每个所述相似子图的某个点,所述点具有标签,使得在单图中具有相同所述标签的点的数量最少;
从所述子图的每个所述相似子图的所述点开始,依次对已有的限制最多的点进行匹配,其中,点的邻居点中已进行匹配的点越多,所述邻居点中未进行匹配的点越少,在所述单图中具有相同所述标签的点的数量越少,表示点的限制越多。
7.根据权利要求1所述的方法,其特征在于,将所述子图的所有所述相似子图的所述匹配图组成匹配图集合,计算所述匹配图集合中最大独立集的所述匹配图的数量包括:
将所述子图的所有所述相似子图的所述匹配图组成匹配图集合,计算所述匹配图集合中最大独立集的所述匹配图的数量的上限,其中,对所述匹配图集合中的每个所述匹配图中的每个点,计算出现有所述点的所述匹配图的数量,从出现数量最多的点开始,保留其中一个所述匹配图,删除其他所有出现有所述点的所述匹配图,依次进行,直至浏览完所有点,此时所述匹配图集合中所述匹配图的数量为所述最大独立集的所述匹配图的数量的上限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810426034.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法及装置
- 下一篇:用水量异常检测方法和数据库服务器