[发明专利]基于正交注意力机制的层次化压缩图匹配方法及系统有效
申请号: | 202010617255.8 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111783879B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 李东升;刘苧;蹇松雷;赖志权;刘锋;陈易欣;黄震 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06V10/74 | 分类号: | G06V10/74;G06V10/82;G06N3/042 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 董惠文 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 正交 注意力 机制 层次 压缩 匹配 方法 系统 | ||
本发明公开了一种基于正交注意力机制的层次化压缩图匹配方法及系统,包括获取拟匹配的大图数据对,对大图数据进行预处理;根据历史图库训练基于正交注意力机制的大图匹配模型;将预处理后的图数据对输入图匹配模型得到匹配结果并输出。本发明在获取图向量的过程中使用图注意力网络对图进行降维训练,对点向量进行更新,使得点向量能更好地表达图拓扑结构及节点信息,然后将降维后的点向量及邻接矩阵输入正交注意力网络进行图规模压缩,通过逐层压缩使得图信息的提取更加细致,最终获得了更为精确的图向量,进而通过压缩后的精确图向量进行图匹配,有利于图匹配结果的准确性,并且计算量小,计算更加快速准确。
技术领域
本发明属于图计算、知识图谱技术领域,尤其涉及一种基于正交注意力机制的层次化压缩图匹配方法及系统。
背景技术
图匹配应用领域非常广泛,例如蛋白质结构匹配、三维对象匹配、路网分析及社交网络学习。其本质是图同构问题,而图同构已被证明是NP完全问题,没有多项式时间内的解,因此两图是否匹配的判定面临许多困难。
通常,学术界对图匹配问题的研究分为两类:精确匹配与近似匹配。人们最初对精确匹配进行了深入研究,产生了一系列图精确匹配算法,其中最具代表性的算法为A*算法。但精确匹配算法存在许多弊端,最突出的缺点在于,精确匹配只能处理16个点以内规模的图,然而随着社会发展,图数据规模日益增大,人们对大图匹配的需求日益增多,这一需求刺激了近似匹配领域的发展。近似匹配算法在匹配速度与准确度之间进行折中,最具代表性的算法包括A*-Beamsearch、Hungarian和VJ算法。但其时间复杂度依然很高,通常为图中节点数量的多项式时间或次指数时间,大图匹配消耗的时间常常难以忍受。
伴随着图表示学习的发展产生了新的解决思路,即基于图神经网络的深度学习方法。这类方法通常利用图表示学习方法获得所输入图对的低维向量表示,进而将图匹配问题转化为向量空间的相似度得分计算问题。然而,实际应用中,多数场景下我们不需要获得两图间确切的相似度得分,对于给定的图三元组(G1,G2,G3),只需知道图G1与G2更相似还是与G3更相似,即进行相对相似度比较。另外,目前的图深度学习方法在几十个点的图上匹配结果较好,泛化至几百点的图准确度偏低,因此提高模型泛化能力也是一个亟待解决的问题。
发明内容
本发明要解决的技术问题是怎样快速准确地对大图进行图匹配,提出了一种基于正交注意力机制的层次化压缩图匹配方法及系统。
为解决该问题,本发明采用的技术方案是:
一种基于正交注意力机制的层次化压缩图匹配方法,包括以下步骤:
步骤1:获取拟匹配的大图数据对,对大图数据进行预处理,所述预处理是指将图进行点向量初始化,所述大图数据是指节点数大于16个点以上的图;所述点向量初始化是指:对于给定包含n个节点(V1,V2,...,Vn)的图G,每个节点都转换为实数向量其中F表示向量初始维度,为人工设定的参数,向量初始化根据节点类型分为两种情况:若图中包含m种类型的节点,则构造维度为m的one-hot向量;若图中只有一种类型的节点,则构造维度为F的向量,每个维度初始值均设为1。
步骤2:根据历史图库训练基于正交注意力机制的大图匹配模型;
步骤3:将预处理后的图数据对输入图匹配模型得到匹配结果并输出。
进一步地,步骤2中所述大图匹配模型的训练方法为:
步骤2.1:获取历史图库中所有的大图数据,对历史图库中的大图数据进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010617255.8/2.html,转载请声明来源钻瓜专利网。