[发明专利]一种基于异质信息网络随机游走的向量表示学习方法及系统在审
申请号: | 202210230949.5 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114611668A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 楼晓俊;李剑;张天荣;冯海林 | 申请(专利权)人: | 浙江农林大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
地址: | 311300 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息网络 随机 游走 向量 表示 学习方法 系统 | ||
本发明公开了一种基于异质信息网络随机游走的向量表示学习方法及系统,包括:多次随机游走获得多个元路径实例,挑选k条元路径实例;对k条的元路径实例中包含的节点进行维度统一,获得该节点的特征向量表示;输入到bi LSTM网络,学习到元路径实例的向量表示;输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和元路径实例的向量进行聚合,得到节点的嵌入向量表示;将节点的嵌入向量,输入到损失函数中,得到损失值,通过优化器多次优化,得到最终的节点向量。本发明可以在链路预测、节点分类、节点聚类以及推荐的任务上取得很好的效果。
技术领域
本发明涉及图神经网络领域,特别涉及一种基于异质信息网络随机游走的向量表示学习方法及系统。
背景技术
近些年来,由于卷积神经网络在图像处理领域取得了卓越的成就,许多研究人员将卷积的思想应用到了图结构上,形成了同质图卷积神经网络,但是由于同质图神经网络在面对异质图结构时,不能区分不同的节点种类和边的种类,所以它在异质图结构上并不能发挥良好的效果。针对这个问题,许多异质图神经网络涌现了出来,但是他们都具有一些缺陷:1、需要人为预定义元路径的类型;2、不能同时考虑所有存在于图结构中的元路径。3、一些模型打乱了异质图中客观存在的序列,所以丢失了可解释性。
因此,需要一种可以自动为每一个节点收集元路径同时不人为定义元路径类型的异质图神经模型。
发明内容
本发明针对传统异质图神经网络需要人为预定义元路径,不能考虑所有元路径对节点影响的问题,提出了一种基于异质信息网络随机游走的向量表示学习方法及系统,基于随机游走的自适应元路径选择的异质图神经网络模型,该模型可以在链路预测、节点分类、节点聚类以及推荐的任务上取得很好的效果。
一种基于异质信息网络随机游走的向量表示学习方法,其特征在于,包括以下步骤:
1)异质信息网络预处理构造多个三元组;
2)多次随机游走获得多个元路径实例,挑选k条元路径实例;
3)对步骤2)获得k条的元路径实例中包含的节点进行维度统一,获得该节点的特征向量表示;
4)将步骤3)获得的节点的特征向量输入到bi LSTM网络,学习到元路径实例的向量表示;
5)将步骤4)获得的元路径实例的向量输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和步骤4)获得的元路径实例的向量进行聚合,得到节点的嵌入向量表示;
6)将步骤5)获得的节点的嵌入向量,输入到损失函数中,得到损失值,通过优化器多次优化,得到最终的节点向量。
步骤1)中,所述的预处理包括:
通过随机负采样的方式构造多个三元组,所述的三元组包括:目标节点、正样本节点、负样本节点。
步骤2)中,多次随机游走获得多个元路径实例,挑选k条元路径实例,具体包括:
2.1)从异质信息网络三元组的节点开始随机游走,当游走到和开始节点类型相同,停止这一次的随机游走,并记录该元路径实例;
2.2)重复步骤2.1),得到多个元路径实例(200~2000,优选1000个);
2.3)从步骤2.2)中的多个元路径实例挑选k(3~10,优选5~6)条;
挑选包括:从出现频率中挑选出最高的k条。
步骤3)中,维度统一包括:将具有不同长度和不同特征的节点映射到相同的语义空间。
步骤4)中,学习公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江农林大学,未经浙江农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210230949.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种夹缝救援器
- 下一篇:基于边缘设备的目标检测方法