[发明专利]一种基于多源点并行探索的图模式匹配方法有效
申请号: | 202011410948.6 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112559807B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 黄文杰;高杨;陈伟;王新根;黄滔 | 申请(专利权)人: | 浙江邦盛科技股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310012 浙江省杭州市西湖*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 源点 并行 探索 模式 匹配 方法 | ||
本发明公开了一种基于多源点并行探索的图模式匹配方法,可用于图数据库中确定点出发的图模式模糊查询。本发明根据层次结构将待查询的模式图分解,以图层为单位进行图遍历查询,可以显著减少探索深度,提高并行探索性能。本发明提出中心模式集和边缘模式集的概念,用于控制探索流程,将探索任务由子图为中心转变为以点为中心,可将算法实现于通用分布式图计算平台。本发明提出了一种合并多源点探索结果的匹配结果精炼方法,通过指定多个辅助源点进行重复探索,利用不同视角带来的图层差异加强对匹配结果的约束,提高匹配精度。
技术领域
本发明涉及大数据领域分布式计算领域,更具体地说,涉及一种基于分布式图计算框架的带标签有向图的图模式模糊匹配方法。
背景技术
随着互联网的发展,人类依托互联网进行的社会经济活动愈发普遍,客观上造成了数据规模的急剧增加。图可以用来建模存在关联关系的社会经济活动,从图中查找复杂的关联模式成为分析实体关联关系的常用方法,但也消耗大量的计算资源。在图的规模不断增长的背景下,降低图模式匹配所需的计算资源就显得极为重要。
以企业贸易网络为例,以交易实体作为节点,交易行为作为有向边。将企业表示为网络中的节点,节点用标签表示各自能提供的产品或服务。节点间存在的有向边的表示企业间发生了一次贸易往来,其权重表示交易数额。贸易网络的模式对图拓扑结构敏感,适用于社交网络分析的图模拟算法不能直接应用在此网络上。对拓扑严格约束的子图同构方法是NP完备问题,其指数增加的时间复杂度也不适合大尺寸图的查询。
发明内容
本发明旨在提供一种面向带标签有向图的图模式模糊匹配方法,在保持多项式时间复杂度的前提下,权衡匹配效率和精度。其特点在于图层分解、多源点探索和结果融合。
本发明的目的是通过以下技术方案来实现的:一种基于多源点并行探索的图模式匹配方法,该方法包括:
(a)将待匹配的模式图记为Q=(Vq,Eq,Lq),其中,Vq表示模式图节点的集合,Eq表示连接节点的边的集合,Lq表示模式图节点的标签的集合;选择模式图的一个节点s∈Vq作为探索源点,以源点s为中心进行深度遍历,用深度值标记模式图节点的层次。将模式图分解为多个图层,每个图层包含相同层次的节点和连接它们的边。
(b)根据待匹配模式图的结构和节点语义,计算中心模式集。根据相邻图层的依赖关系计算边缘模式集。Vq的每一个节点均包含自己的中心模式集,其包括该节点的标签,及其父子节点的id。对于层级d>0的节点其边缘模式集为中心模式集的子集,只包含层级d-1的父子节点id。中心模式集和边缘模式集包含了图逐层探索过程中的全部结构约束。定义图层的深度为D,则图层的探索步骤最少进行D次,最多进行2D次,且前D次为扩张阶段,同时存在添加新的可匹配节点和去除失配节点,探索D次之后为收敛阶段,不再添加新节点,只去除失配节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江邦盛科技股份有限公司,未经浙江邦盛科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011410948.6/2.html,转载请声明来源钻瓜专利网。