[发明专利]一种基于抽样的无向图结构数据比较方法在审
申请号: | 201410799404.1 | 申请日: | 2014-12-19 |
公开(公告)号: | CN104504056A | 公开(公告)日: | 2015-04-08 |
发明(设计)人: | 李刚;宁立;张涌 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙)44316 | 代理人: | 沈祖锋;郝明琴 |
地址: | 518055广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 抽样 结构 数据 比较 方法 | ||
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于抽样的无向图结构数据比较方法。
背景技术
图是一种基本的数据结构,图论中的图是由若干顶点和连接顶点的线所构成的图形,作为图论的基本研究对象,图具有重要的研究意义和广泛的应用背景。凡是涉及排列组合优化的问题,都能够要用到图的相关知识,例如在通信编解码,矩阵运算,任务分配,路径规划,网络流,游戏寻路,聚类研究,数据挖掘等等领域中图都扮演着十分重要的地位。
图的相似性研究和图匹配是图的众多算法研究中的一个分支,是一个十分重要的研究课题。图的相似性和匹配问题属于图同构判定问题,这是一个NP完全问题,传统的高开销搜索算法无法满足现今对海量数据快速处理的需要。
作为一个比较小的研究分支,图相似性描述和匹配算法的研究就是建立在前人的一些经典算法之上,受到这些算法思想的启发,来提出和优化一些新的算法,使图匹配算法的适应性更广,能够在各种特殊的应用条件下求解,下面是在一些具体应用问题中提出的一些算法。Giugno和Shasha提出GraphGrep路径索引构造技术,对查询图求出它们所有的路径集合,设定路径阀值,然后对图进行扫描,计算结果。该算法存在的问题是扫描过程中必须进行子图同构计算。Chen等人提出一种图包含搜索算法,算法中指出,在某些相似的图间包含有一些完全一样的结构,那么这两个图是相似的。但是包含搜索本质上是精确匹配搜索,存在的最大问题是返回结果集较小,在实际应用中无法满足要求。
发明内容
有鉴如此,有必要提供能快速处理海量数据的一种基于抽样的无向图结构数据比较方法。
为实现上述目的,本发明采用下述技术方案:
一种基于抽样的无向图结构数据比较方法,包括下述步骤:
步骤S110:提供两个无向图,并分别记为G和W,所述G和W的节点按照从1到n进行标记,记为S={x|1≤x≤n},其中,S为整数集合,循环次数记为T;
步骤S120:随机从所述整数集合S中任意选定一个数,记为i,并将整数i从S中删除;
步骤S130:从所述G和所述W中的各自取出编号为i的节点,分别记为gi和wi节点;
步骤S140:比较所述gi和所述wi节点的邻接信息,所述邻接信息表示其所在邻接矩阵中对应的行;
步骤S150:判断所述gi和所述wi的邻接信息是否相同,若判断结果为“否”则报告所述G和所述W不同;
步骤S160:若上述判断结果为是,则跳转到步骤S120循环执行;
步骤S170:若循环执行完T次后,没有报告所述G和所述W的不同,则报告G和W相同。
优选地,所述G和W采用邻接矩阵进行表示和存储。
优选地,比较所述gi和所述wi节点的邻接信息,所述邻接信息表示其所在邻接矩阵中对应的行,具体为:
将所述gi和wi节点的邻接矩阵行进行逐位异或运算,或者逐位相减运算,只要有一位运算的结果不是0,则表示gi和wi的邻接信息不同,若全部运算结果都是0,则表示gi和wi的邻接信息相同。
优选地,所述无向图为无权无向图。
本发明提供的基于抽样的无向图结构数据比较方法,采用随机抽样比较节点领接信息的方式,来判断两个无向图是否相同,相对于现有的图的相似性算法,本发明设计的方法具有更好的效率,而且能够很好的应用于海量数据处理;当图的规模较大时,也能得到很好的运行效果;且当断定两个图不同时,能够确保一定不同,当断定不同时,也能够高概率的保证结果的正确性;同时,本发明提供的基于抽样的无向图结构数据比较方法具有很好的通用性,能扩展到加权无向图的比较。
附图说明
图1是本发明提供的基于抽样的无向图结构数据比较方法的步骤流程图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,为本发明提供的基于抽样的无向图结构数据比较方法的步骤流程图,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院;,未经中国科学院深圳先进技术研究院;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410799404.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置