[发明专利]一种重启式随机游走的新型网络嵌入学习方法在审
申请号: | 201910113316.4 | 申请日: | 2019-02-13 |
公开(公告)号: | CN109919198A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 李建欣;何雨;彭浩;张帅;胡春明 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机游走 重启 嵌入 新型网络 关系信息 网络数据 迭代 学习 重复 网络 | ||
1.一种重启式随机游走的新型网络嵌入学习方法,其特征在于,包括以下步骤:步骤1,获取实体及其关系信息建立网络数据;步骤2,重复迭代进行游走和训练;所述步骤2中包括重启式随机游走和网络嵌入训练两部分。
2.如权利要求1所述的方法,其特征在于,在所述步骤1中,所述获取实体及其关系信息建立网络数据的具体方式为,对输入的各种各样的数据及其之间的关系进行清洗和过滤,然后抽取数据中的实体作为网络中的节点,实体之间的关系作为网络中的边,将数据构建成网络形式,并向下一模块进行推送。
3.如权利要求2所述的方法,其特征在于,在所述步骤2中,所述重复迭代进行游走和训练的具体方式为:步骤2-1,将网络的全体节点打乱顺序排成一个序列,依次从每一个节点出发,执行重启式随机游走和网络嵌入训练:步骤2-2,从一个节点出发进行重启式随机游走,产生一个节点序列;步骤2-2,用该节点序列进行网络嵌入训练;步骤2-3,重复以上操作若干轮次,直至达到给定轮次或者训练误差达到给定精度。
4.如权利要求3所述的方法,其特征在于,在所述步骤2-2中,所述从一个节点出发进行重启式随机游走,产生一个节点序列的具体步骤为:
步骤3-1,将选择的节点标记为起始节点;
步骤3-2,从起始节点出发,从其邻居节点中随机选择一个节点,并转移到该节点中,记为当前节点;
步骤3-3,若游走长度达到给定的长度,则进入步骤3-6,停止游走,否则继续执行,所述游走长度为转移次数;
步骤3-4,以一定概率转移到出发节点,即随机产生一个0~1之间的数,如果小于给定的转移概率,则转移到起始节点,此时起始节点也是当前节点,并回到步骤3-3,否则执行步骤3-5;
步骤3-5从当前节点的邻居节点中随机选择一个节点,转移到该节点中,记为当前节点,并回到步骤3-3;
步骤3-6最终,从一个起始节点出发,得到一个固定长度的邻居节点序列。所述重启式随机游走的转移过程公式为:
Pk=αI+(1-α)Pk-1A,k=1,2,…
其中Pk是重启式随机游走的k步转移概率,I是单位阵,α是在每一步转移过程中跳转回起始节点的概率,A是网络的归一化邻接矩阵,也是普通随机游走的单步转移概率矩阵,所述重启式随机游走的k步内平均转移概率为:
5.如权利要求4所述的方法,其特征在于,在所述步骤2-2中,所述用该节点序列进行网络嵌入训练的方法具体为,一个给定的起始节点v,从其出发通过重启式随机游走得到的邻居节点序列为Neighbor(v)={c1,c2,c3,…,cn},所述n为游走总数,通过最小化目标函数来进行网络嵌入训练:
其中,
其中,V是网络中的全体节点集合,vv是节点v的嵌入向量,uc是节点c的上下文向量,
然后,采用负采样处理,将Pr(c|v,θ)更新为:
其中m是负采样的个数,Pn(v)为执行负采样时的噪声分布,最后,通过采用梯度下降最小化目标函数,完成对节点的嵌入向量进行训练更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910113316.4/1.html,转载请声明来源钻瓜专利网。