[发明专利]一种多结构文本图神经网络的相关方法和相关装置有效
申请号: | 202310016212.8 | 申请日: | 2023-01-06 |
公开(公告)号: | CN115759183B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 赵坤;王立;李仁刚;赵雅倩;范宝余;鲁璐;郭振华 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06N3/042 | 分类号: | G06N3/042;G06N3/045;G06N3/084;G06N5/046 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 250000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结构 文本 神经网络 相关 方法 装置 | ||
1.一种多结构文本图神经网络的训练方法,其特征在于,包括:
基于多结构文本的不同语义信息进行图网络构建,得到初始多结构文本图神经网络;其中,所述初始多结构文本图神经网络包括提取节点特征层、构建连接关系层、构建图层以及构建近邻关系层;其中,所述多结构文本为按照其语义不同划分为多种结构类别的文本;其中,所述构建近邻关系层,用于基于节点与节点之间的连接数对对应节点的图神经网络的边进行加权计算,得到对应的节点特征;所述连接数为节点与节点之间的路径数量;
将正负样本之间的距离越来越远为目标构造对比损失函数;
基于所述对比损失函数和训练数据对所述初始多结构文本图神经网络进行训练,得到所述多结构文本图神经网络;
所述加权计算的过程包括:
根据与节点间的连接数对所有其他节点进行降序排序,截取排序结果中的前K个节点,将所述前K个节点作为所述节点的邻居,并依照如下公式对所述节点和所述前K个节点间的边进行加权计算:
;
其中,表示节点之间的连接关系,并表征节点之间的边的权重信息;表示之间的连接数。
2.根据权利要求1所述的训练方法,其特征在于,所述提取节点特征层,用于对所述多结构文本的文本信息进行特征编码,得到每个样本对应的特征编码;
所述构建连接关系层,用于将每个样本作为节点,并基于每个节点的语义信息构建每个节点之间的连接关系;
所述构建图层,用于基于每个节点之间的连接关系构建出所述节点对应的图神经网络;
所述构建近邻关系层,用于基于节点与节点之间的连接数对对应节点的图神经网络的边进行加权计算,得到对应的节点特征。
3.根据权利要求1所述的训练方法,其特征在于,所述提取节点特征层,具体用于对所述多结构文本的文本信息进行特征编码,得到每个文字的特征向量,通过注意力网络对所述文本信息的所有特征向量进行处理,得到所述多结构文本的文本信息的特征编码。
4.根据权利要求1所述的训练方法,其特征在于,将正负样本之间的距离越来越远为目标构造对比损失函数,包括:
建立对应节点的正样本组,并基于所述正样本组建立对应的负样本组;
将所述正样本组与所述负样本组之间的距离越来越远作为目标构造所述对比损失函数。
5.根据权利要求1所述的训练方法,其特征在于,基于所述对比损失函数和训练数据对所述初始多结构文本图神经网络进行训练,得到所述多结构文本图神经网络,包括:
基于所述训练数据和所述对比损失函数对所述初始多结构文本图神经网络进行迭代训练,直至所述对比损失函数收敛,得到所述多结构文本图神经网络。
6.根据权利要求1所述的训练方法,其特征在于,将正负样本之间的距离越来越远为目标构造对比损失函数,包括:
将与目标节点相连的邻居节点构成正样本组,将除正样本组之外的样本及其邻居节点组成负样本组;
以所述正样本组和所述负样本组之间的距离越来越大作为目标构造第一对比损失函数;
对每个节点构建均方差损失函数;
将所述第一对比损失函数与所述均方差损失函数的和作为所述对比损失函数。
7.根据权利要求6所述的训练方法,其特征在于,将与目标节点相连的邻居节点构成正样本组,包括:
基于所述目标节点与其他节点之间的连接关系,确定所述目标节点的邻居节点;
将所有所述邻居节点作为所述正样本组。
8.根据权利要求6所述的训练方法,其特征在于,将除正样本组之外的样本及其邻居节点组成负样本组,包括:
确定参与推理计算的所有节点的集合;
将所有节点的集合减去所述正样本组的节点,得到所述负样本组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310016212.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种骨科用多功能辅助行走装置
- 下一篇:一种基于虚拟现实数据的数据处理系统