[发明专利]子图匹配装置及子图匹配的方法有效
申请号: | 201210586892.9 | 申请日: | 2012-12-28 |
公开(公告)号: | CN103077216A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 曾理;成杰峰;冯圣中 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 宋鹰武 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 匹配 装置 方法 | ||
技术领域
本发明涉及数据查找技术,尤其涉及一种对大型数据图进行子图匹配的子图匹配装置及子图匹配的方法。
背景技术
随着网页技术和新的数据管理与存储技术的发展,图结构的数据变得越来越普遍。图结构能够清晰的表现对象之间的复杂关系。许多应用需要处理图结构的数据,比如语义网[1]、生物信息学中的蛋白质交互网络[2]和社会科学中的社交网络等。这些应用要求有效的存储和分析单个或多个大型图数据。
在分析图数据时,经常需要对图进行查询,与关系数据库中的查询不同,图的查询一般基于图的结构。大体上可以将与图有关的查询分成三类。第一类是关于路径的查询,如最短路径查询[35]要求找出两个顶点之间的最短路径,可达性查询[5–8]要求判断两个顶点之间是否有路径相连。第二类与顶点有关,例如最近邻居顶点查询[9,10]查找与给定顶点最接近的邻居顶点。第三类是子图查询[11,12],要求找出需要的子图结构,例如子图同构、子图匹配和频繁子图挖掘,相比路径和顶点的查询,子图查询更能挖掘图的信息。这些查询操作是许多应用的基础,因此快速处理这些查询十分重要。
传统上,子图匹配是指子图同构。给定查询图Q和数据图G,子图同构要求找出G中与Q有着相同结构的子图。子图同构在数据库方面的主要应用是频繁子图挖掘。在很多情况下,尤其在万维网迅速发展的现在,很多应用通常需要处理单个大型的数据图,如连接分析、社交网络和语义网。为高效的管理和分析大型数据图,逐渐在原有的子图同构问题上发展出一种新的子图匹配问题,该子图匹配问题对标签图进行查询。标签图是指图中每个顶点或边都有一个标签,如社交网络中,工作职位可以作为每个用户顶点的标签。一个查询图Q代表要查询的模式,查询图的顶点也带有标签。子图匹配问题要求查询的匹配结果同时满足标签条件和结构条件:(1)标签条件,Q中顶点的标签要与G中匹配顶点的标签相同;(2)结构条件,对Q中的边,G中相应匹配的顶点之间要有路径相连。因此子图同构要求边与边的严格匹配,而这种子图匹配问题要求查询图中的边与数据图中的路径匹配。
1、现有的查找子图匹配的算法并未考虑top-k的问题。面对大型数据图,给定查询的匹配结果集十分巨大,因此采用已有的子图匹配算法找出全部匹配,然后通过排序取得top-k结果会十分耗时。
2、现有的top-k连接算法能够直接用来求解top-k的子图匹配,但对该算法的分析和实验表明,此算法并不具备较好性能,尤其是针对大型的数据图。已有的top-k子树匹配算法无法直接用于求解top-k子图匹配。
[1]B.Berendt,A.Hotho,and G.Stumme.Towards semantic web mining.The Semantic Web―ISWC2002,pages264–278,2002.
[2]J.Van Helden,A.Naim,R.Mancuso,M.Eldridge,L.Wernisch,D.Gilbert,S.J.Wodak,et al.Representing and analysing molecular and cellular functionusing the computer.Biological Chemistry,381(9/10):921–936,2000.
[3]E.P.Chan and H.Lim.Optimization and evaluation of shortest path queries.The VLDB Journal―The International Journal on Very Large Data Bases,16(3):343369,2007.
[4]N.Jing,Y.W.Huang,and E.A.Rundensteiner.Hierarchical encoded path views for path query processing:An optimal model and its performance evaluation.Knowledge and Data Engineering,IEEE Transactions on,10(3):409–432,1998.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210586892.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能家用烤箱
- 下一篇:炊具蒸汽余热回收装置