[发明专利]一种基于异质信息网络随机游走的向量表示学习方法及系统在审
申请号: | 202210230949.5 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114611668A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 楼晓俊;李剑;张天荣;冯海林 | 申请(专利权)人: | 浙江农林大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
地址: | 311300 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息网络 随机 游走 向量 表示 学习方法 系统 | ||
1.一种基于异质信息网络随机游走的向量表示学习方法,其特征在于,包括以下步骤:
1)异质信息网络预处理构造多个三元组;
2)多次随机游走获得多个元路径实例,挑选k条元路径实例;
3)对步骤2)获得k条的元路径实例中包含的节点进行维度统一,获得该节点的特征向量表示;
4)将步骤3)获得的节点的特征向量输入到bi LSTM网络,学习到元路径实例的向量表示;
5)将步骤4)获得的元路径实例的向量输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和步骤4)获得的元路径实例的向量进行聚合,得到节点的嵌入向量表示;
6)将步骤5)获得的节点的嵌入向量,输入到损失函数中,得到损失值,通过优化器多次优化,得到最终的节点向量。
2.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤1)中,所述的预处理包括:
通过随机负采样的方式构造多个三元组,所述的三元组包括:目标节点、正样本节点、负样本节点。
3.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2)中,多次随机游走获得多个元路径实例,挑选k条元路径实例,具体包括:
2.1)从异质信息网络三元组的节点开始随机游走,当游走到和开始节点类型相同,停止这一次的随机游走,并记录该元路径实例;
2.2)重复步骤2.1),得到多个元路径实例;
2.3)从步骤2.2)中的多个元路径实例挑选k条;
4.根据权利要求3所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2.2)中,多个元路径实例为200~2000个。
5.根据权利要求3所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2.3)中,k为3~10。
6.根据权利要求3所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤2.3)中,挑选包括:从出现频率中从高到低挑选出最高的k条。
7.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤3)中,维度统一包括:将具有不同长度和不同特征的节点映射到相同的语义空间。
8.根据权利要求1所述的基于异质信息网络随机游走的向量表示学习方法,其特征在于,步骤4)中,学习公式为:
v1,v2,v3∈P
F=concat(f(v1),f(v2),f(v3))
其中,(v1,v2,v3)代表了元路径实例P上的节点,f(v1)、f(v2)、f(v3)代表了节点的特征向量,concat为拼接函数,F为拼接后的向量,LSTM为一种神经网络结构,embedding为学习得到的元路径实例向量表示。
9.一种基于异质信息网络随机游走的向量表示学习系统,其特征在于,包括:
元路径采集模块,用于从异质信息网络三元组的节点开始随机游走到和开始节点类型相同,记录该元路径实例,重复得到多个元路径实例,从多个元路径实例挑选k条;
节点特征聚合模块,用于对k条的元路径实例中包含的节点进行维度统一获得该节点的特征向量表示;
元路径实例聚合模块,用于将节点的特征向量输入到biLSTM网络,学习到元路径实例的向量表示;
注意力层模块,用于将获得的元路径实例的向量输入注意力层,先学习到每一条元路径实例对于节点的影响因子,然后通过注意力机制将影响因子和元路径实例的向量进行聚合,得到节点的嵌入向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江农林大学,未经浙江农林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210230949.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种夹缝救援器
- 下一篇:基于边缘设备的目标检测方法