[发明专利]一种基于图匹配网络的可对比学习对象生成方法及系统有效

申请号：	202110249307.5	申请日：	2021-03-08
公开（公告）号：	CN113095361B	公开（公告）日：	2023-05-12
发明（设计）人：	郑庆华;肖天安;田锋;梁曦;武云封;张玲玲;魏笔凡	申请（专利权）人：	西安交通大学
主分类号：	G06F18/2415	分类号：	G06F18/2415;G06F18/22;G06N3/0499;G06N3/042
代理公司：	西安通大专利代理有限责任公司 61200	代理人：	姚咏华
地址：	710049 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于匹配网络对比学习对象生成方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图匹配网络的可对比学习对象生成方法，其特征在于，包括以下步骤：

S1，通过解析半结构化数据获得两个学习对象间的关系和学习对象的初始属性集合；

S2，通过属性的信念传播持续更新初始属性集合中每个属性属于该学习对象的概率值，将初始属性集合中所有属性的概率值进行迭代传播，直到所有概率值处于稳定状态；

S3，根据概率值处于稳定状态的属性所对应的学习对象，利用该学习对象所对应的属性词进行相关性操作得到两个属性词的注意力权重；

S4，将包含两个属性词的所有句子的特征表示进行加权作为整个句子特征向量，将句子特征向量采用Softmax分类器计算得到关联概率，根据两个属性词的注意力权重以及两个属性词所属句子的关联概率，即可得到两个学习对象对应属性之间的关联图信息，基于关联图信息分别计算两个学习对象间的整体图匹配和局部图匹配，得到候选对比对象结果，采用属性节点权重值与Ferilli的结构相似性度量方法计算两个学习对象间的相似度，对比对象结果中两个学习对象间的相似度大于设定阈值的即为最终的可对比学习对象；

具体的，采用GMN网络进行结构对齐：

I)图结构特征表示：拟采用图神经网络(GraphNeural Network，GNN)来表征学习对象的图结构；将一对学习对象的属性图作为输入，对于每个属性图，首先通过多层感知器(Multilayer Perceptron，MLP)来编码各个属性节点的特征和边的特征e_i，j，经过多层网络传播，得到f_i的特征表征作为后续的输入；

II)整体和局部结构分离：一个学习对象的属性图定义为G＝{G′，G^*}，其中G′表示通过池化操作对图结构进行简化；是同时利用多个特征向量进行上采样来得到的各个局部信息表示；

III)结构对齐：利用GMN来分别计算一对学习对象的整体和局部图匹配，将两者的匹配结果用来判断是否作为可对比学习对象的候选结果，采用Page Rank计算方法来计算属性节点权重值，来实现学习对象间的结构对齐；

学习对象的相似度计算：

设学习对象的属性图G_F由属性F＝{f_i}，i＝1，…，l及之间的关联组成；对于每一个属性节点f_i，采用PageRank算法；节点f_i的PageRank计算步骤如下：首先设置收敛值ξ和可调参数η，初始化每个属性节点的PR值为通过下式进行迭代计算：

其中，I(v_i)表示指向属性v_i的所有属性集合，|O(v_j)|是属性节点v_j的中心度；计算收敛条件||PR^t+1-PR^t||＜ξ，满足收敛条件之后得到最终的PageRank值PR＝{pr₁，...，pr_n}；最后利用Softmax函数来计算每个属性的权值，形式如下：

学习对象间相似度计算：设F_o、分别表示学习对象o与o^*的属性集；将属性权重与Ferilli的结构相似性度量方法相结合，以下公式用于度量学习对象o^*与o的相似度：

上式中，表示o^*与o公共属性集中所有属性的权重之和；表示仅属于学习对象o的属性的权重之和；表示仅属于o^*的属性的权重之和；

已知学习对象o的属性集F，对任意两个属性f_i，f_j∈F，判断两者间的关联r(f_i，f_j)是否存在，包括以下三个步骤：

1)属性词和句子的输入表示：对于每一个包含属性关联词对的句子s，其第k个词表示为其中为该词的嵌入表示，和分别为两个目标属性词在该句子中的位置信息表示，于是整个句子可以表示为s＝(ω₁，ω₂，...)，接着通过卷积操作对句子进行特征提取，得到整个句子的特征表示，则包含该属性词对的所有句子特征表示为：S＝(s₁，s₂，…)；

2)注意力机制引入：

属性词的Attention：将句子s的每个词分别与属性关联词对进行相关性操作，得到两个相关性对角矩阵Aⁱ和A^j，该矩阵可以描述属性词实体和每个单词之间的关联强度，其对角线元素值分别为：其中ω_k表示第k个单词，函数g表示内积操作，用下式将矩阵进行参数化：

其中衡量第k个词与属性词f_i之间的相关性，并将两个属性词的系数简单加权；

属性句子的Attention：为了将包含一对关联词的所有句子的特征表示S＝(s₁，s₂，…)进行加权作为整个特征向量，函数r(f_i，f_j)表示属性词f_i和f_j之间的关联特征信息，则句子的注意力权重定义为：

ω_i＝W tanh(s_i，r)+b

其中W表示权重矩阵，b表示偏置，β＝(β₁，β₂，...)是所有句子的权重向量；加权计算得到所有句子的特征向量：

3)关联概率计算：将特征向量送入softmax分类器计算关联概率，进而判断输入的属性词之间是否相关联：

其中W_s和b_s为权重和向量，P_i，j为属性词f_i和f_j之间有关联的概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安交通大学，未经西安交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110249307.5/1.html，转载请声明来源钻瓜专利网。