[发明专利]一种基于图神经网络的小样本关系分类方法在审
申请号: | 202310262708.3 | 申请日: | 2023-03-17 |
公开(公告)号: | CN116401591A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 杨丽娜;王佳艺;杨浩燕;王家乐;王菁;李微;景利伟;员煜简 | 申请(专利权)人: | 广西大学 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/22;G06N5/02;G06N3/042;G06N3/08 |
代理公司: | 桂林文必达专利代理事务所(特殊普通合伙) 45134 | 代理人: | 张学平 |
地址: | 530004 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 样本 关系 分类 方法 | ||
1.一种基于图神经网络的小样本关系分类方法,其特征在于,包括下列步骤:
步骤1:支持集和查询集中的句子样本通过编码器获得句子样本结点的特征向量表示;根据每个句子样本的类别标签生成边标签矩阵;
步骤2:使用边标签矩阵信息更新支持集和查询集中的每个句子样本结点的特征向量表示,通过图神经网络提取出结点最终特征表示;
步骤3:将支持集按类别标签通过加权计算进行聚合生成支持类原型;对每个查询样本的特征表示计算其与支持类原型的相似度;取相似度最高的作为查询样本的分类结果。
2.如权利要求1所述的基于图神经网络的小样本关系分类方法,其特征在于,
所述支持集和所述查询集组成训练数据集合,其中支持集由N个关系类别下每类K个实例组成,查询集由N个关系类别下每类Q个实例组成,记为其中表示N*K个句子实例之一,表示句子对应标注的N个关系类别之一。
3.如权利要求2所述的基于图神经网络的小样本关系分类方法,其特征在于,
对每个句子实例xi,通过提取句子中所有词的词向量与两个实体的位置向量,经由卷积神经网络进行编码,得到特征向量Xi,对于每一组的N*(K+Q)个实例,根据所有实例所在类别生成大小为N*(K+Q)×N*(K+Q)的边标签矩阵E,边标签矩阵依据实例是否在同一类别进行初始化。
4.如权利要求3所述的基于图神经网络的小样本关系分类方法,其特征在于,
步骤2的总体过程表示为X(l+1)=GE2N(X(l))=ReLU(f(XE(l))),使用边标签矩阵与注意力机制交互支持集和查询集样本,即针对网络层中第l+1的特征向量X(l+1),可以用前一层的特征向量X(l)通过设计的图神经网络GE2N进行计算更新,图神经网络GE2N中具体是由一层表示为f的注意力权重计算以及一层ReLU激活函数组成;
在注意力权重计算f中,首先根据过程中的特征向量表示矩阵计算其中支持集和查询集之间的相关性,具体使用支持集中每个类别的特征向量与查询集所有的特征对应的Q计算相关性再使用相关性α计算第i个支持样本和第j个查询样本的特征向量,可分别表示为连接总的支持集样本和查询集样本得到新的一层的特征向量表示
5.如权利要求4所述的基于图神经网络的小样本关系分类方法,其特征在于,
对每个支持集样本中的N个类别,求所有样本平均生成类别原型,生成第p个类别对应的原型特征向量表示为对每个查询样本的特征表示计算其与支持类原型的相似度的过程中,计算每个查询样本与原型的相似系数,即每个查询样本属于支持类的概率βp:即为支持类原型与查询集原型通过两个全连接层MLP1和MLP2进行相似度计算,中间经由一层ReLU函数进行激活,最后通过判断βp中的最大值对应的种类p进行分类。
6.如权利要求5所述的基于图神经网络的小样本关系分类方法,其特征在于,
使用交叉熵损失函数来计算损失,具体为使用每个元任务的查询集的真实值和预测值之间的交叉熵进行计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310262708.3/1.html,转载请声明来源钻瓜专利网。