[发明专利]一种面向多模式图匹配的并行加速方法有效
申请号: | 201811228936.4 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109614520B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 于静;郭晶晶;刘小梅;刘燕兵;曹聪;谭建龙;郭莉 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 模式 匹配 并行 加速 方法 | ||
1.一种面向多模式图匹配的并行加速方法,其步骤包括:
1)生成目标领域的模式图集的多模式图索引;
2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;其中得到每个模式图的匹配代价的方法为:首先根据模式图是否存在同构子图将模式图分为基础模式图和扩展模式图;所述基础模式图是指在模式图集P={P1,P2,...,Pn}中,如果Pi∈P并且Pi的任意子图不属于P,那么Pi称为基础模式图,P为模式图Pi所在层的模式图集合;所述扩展模式图是指在模式图集P={P1,P2,...,Pn}中,如果Pi∈P并且存在Pi的某一子图属于P,那么Pi称为扩展模式图;然后对于基础模式图,其匹配代价为Cost(pi)=|Ni|*(|Vi|+|Ei|),其中,Ni表示模式图Pi待匹配的数据规模,Vi和Ei分别表示模式图Pi中结点和边的集合;对于扩展模式图,其匹配代价为Cost(pj)=|IF(j)|*Score(j,F(j)),其中,F(j)代表模式图pj的父模式图,IF(j)表示F(j)在模式图pj所在层的上一层的匹配结果,Score(j,F(j))表示模式图pj与模式图F(j)在所述多模式图索引中所对应边的权重;
3)对不同分组分别分配一线程同时进行匹配计算。
2.如权利要求1所述的方法,其特征在于,生成所述多模式图索引的方法为:首先生成所述模式图集的模式关联图;所述模式关联图是一个由模式图为结点、模式图间同构关系为边的有向无环图,记录模式图集中所有的子图同构关系;然后基于所述模式关联图构建的确定根结点情况下的最小生成树作为所述多模式图索引。
3.如权利要求2所述的方法,其特征在于,对于所述模式关联图中,如果一个节点具有多个父节点,则保留该节点与其多个父节点的所有有向边中权重最小的边,其余的边删除,形成所述最小生成树。
4.如权利要求3所述的方法,其特征在于,模式图Pi与Pj之间的有向边Eij的权重为Score(j,i)=|Vj|-|Vi|+|Ej|-|Ei|;其中,|Vi|代表模式图Pi的结点数,|Ei|代表模式图Pi的边数,|Vj|代表模式图Pj的结点数,|Ej|代表模式图Pj的边数。
5.如权利要求1所述的方法,其特征在于,根据匹配代价对同一层的模式图进行分组的方法为:基于模式图的匹配代价,采用分割问题中的完全贪心算法实现模式图的分组:首先根据模式图的匹配代价计算模式图的权重,将同一层中的模式图分为权重之和相差最小的若干组。
6.如权利要求5所述的方法,其特征在于,根据模式图的权重对模式图进行降序排列,选择前k个模式图作为初始分组结果,对剩余的每个模式图选择当前权重之和最小的组加入,直到所有模式图被划分到各个组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811228936.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据导入方法和数据导入装置
- 下一篇:一种高效的隐私保护子图查询处理方法