[发明专利]一种生成多关系图中节点的表示向量的方法在审
申请号: | 202110576078.8 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113298234A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈益强;黄武亮;蒋鑫龙;吴启晨 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 关系 节点 表示 向量 方法 | ||
1.一种生成多关系图中节点的表示向量的方法,其特征在于,包括步骤:
A1、获取从多关系图中分解出的多个单一关系子图并对每个单一关系子图分别编码,得到编码后的多个单一关系子图;
A2、对每个编码后的单一关系子图进行潜在关联预测并针对可能具有的潜在关联构建边,得到多个补充潜在关联后的关系子图;
A3、对多个补充潜在关联后的关系子图进行聚合,得到基于潜在关联的特征聚合图;
A4、从所述基于潜在关联的特征聚合图中提取每个节点的表示向量。
2.根据权利要求1所述的方法,其特征在于,所述步骤A1包括:
A11、获取根据多关系图的关系种类中每一种关系分别从多关系图中提取的仅具有该关系的单一关系子图;
A12、基于对不同的单一关系子图使用与之对应的不同编码器进行编码,得到编码后的多个单一关系子图。
3.根据权利要求2所述的方法,其特征在于,所述步骤A2包括:
A21、根据每个编码后的单一关系子图中的现有连接关系为每个节点获取二阶可达邻居并建立两跳的边;
A22、根据两跳的边所连接节点的节点特征使用边卷积算法生成两跳的边的第一特征;
A22、针对两跳的边基于第一特征使用潜在关联预测算法预测其对应的潜在关联是否存在,保留可能具有的潜在关联对应的边。
4.根据权利要求3所述的方法,其特征在于,所述潜在关联预测算法是耿贝尔柔性最大值算法,通过输出的边的第二特征的值判断对应的两跳的边是否存在,其中,边的第二特征表示为:
其中,表示输出的边ei,j的第二特征,是根据独立同分布的标准耿贝尔分布为边ei,j生成的随机变量,为0~1的均匀分布,SoftMax(·)代表柔性最大值函数,log(·)表示取对数;表示输入的边ei,j的第一特征,其中,·|·代表向量拼接操作,W是一个仿射变换矩阵,表示节点i的第二特征,表示节点j的第二特征,边的第二特征为第一数值时表示该边存在,边的第二特征为第二数值时表示该边不存在。
5.根据权利要求4所述的方法,其特征在于,所述步骤A3包括;
A31、使用节点特征聚合算法对多个补充潜在关联后的关系子图中的节点进行聚合,其中,节点特征聚合算法基于长短记忆神经网络根据不同补充潜在关联后的关系子图中的节点特征进行聚合,得到每个节点的聚合特征;
A32、使用连接关系聚合算法对多个补充潜在关联后的关系子图中的连接关系进行聚合;
A33、基于聚合后的节点和聚合后的连接关系得到基于潜在关联的特征聚合图。
6.根据权利要求5所述的方法,其特征在于,所述节点特征聚合算法对应的公式表示为:
其中,Xaggregate表示节点的聚合特征的集合,表示连接关系rk对应的单一关系子图中节点的第二特征集,表示用单层双向LSTM网络进行特征聚合。
7.根据权利要求4所述的方法,其特征在于,所述步骤A4包括:
A41、获取所述基于潜在关联的特征聚合图,包括节点、节点间连接关系、关联关系,其中,节点的特征采用聚合特征;
A42、根据图神经网络从所述特征聚合图中提取每个节点的表示向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110576078.8/1.html,转载请声明来源钻瓜专利网。