[发明专利]一种基于分层负采样的网络表示学习方法在审
申请号: | 202211007471.6 | 申请日: | 2022-08-22 |
公开(公告)号: | CN115422445A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 陈俊扬;伍楷舜;巩志国;戴志江 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/9538;G06K9/62;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏;朱伟军 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 采样 网络 表示 学习方法 | ||
1.一种基于分层负采样的网络表示学习方法,包括以下步骤:
针对网络G=(V,E),获取一组随机游走序列S={s1,…,sM},其中,N为顶点集合的大小,M表示随机游走的次数,V表示顶点集,表示边的集合,每个游走序列s由一组顶点组成{v1,…,vN};
对于每组随机游走序列,对顶点的领域信息进行建模,以确定目标顶点的潜在社区结构;
基于所述潜在社区结构,为各顶点计算其为目标顶点的负样本的概率,以采样负样本;
基于所采样的负样本优化设定的目标函数,进而确定顶点表示学习向量。
2.根据权利要求1所述的方法,其特征在于,利用层次狄利克雷过程生成概率图模型来确定所述潜在社区结构,包括以下步骤:
对所有已知的社区C进行概率分布的建模G0∣γ,C~Dir(γ/C),其中,G0表示狄利克雷过程的基分布,Dir(γ/C)表示随机游走序列关于社区相关程度的狄利克雷先验分布,γ是超参数,C表示社区的数量大小;
对于每个社区c∈{1,2,…,C},将每个顶点属于该社区的概率设置为其中,Dir(β)表示随机游走序列中某个顶点关于社区相关程度的狄利克雷先验分布,β是超参数;
对于每个游走序列s,根据权重θs∣α,G0~DP(α,G0),采样获取该游走序列所在的社区,并且对于该游走序列中的每个顶点v∈{v1,v2,…,vN}执行:
根据权重ZS,v∣θS~Multinomial(θS),为顶点采样一个社区的分配;
从分配的社区中获取顶点的生成概率
其中,DP表示狄利克雷过程,α代表顶点v属于所分配的新社区的权重,表示在社区c中与该社区相关的顶点的概率分布,表示序列s中的顶点v与采样出来的某个社区的相关程度的权重,Multinomial表示多项式。
3.根据权利要求2所述的方法,其特征在于,采用吉布斯采样对所述概率图模型的参数进行推理,包括:
对于游走序列s,该游走序列中的每个顶点v,存在一个潜在的社区权重的分布Zs,v;
利用狄利克雷分布是多项式分布的共轭先验分布的特性,将与社区分布相关的参数θS和被积分消掉,进而对于游走序列s内的除当前顶点v以外的其他顶点,获得游走序列s中其它顶点的社区分配信息以及在社区c中除游走序列s外其它顶点的分布情况
为顶点v选择已存社区或新社区。
4.根据权利要求3所述的方法,其特征在于,为顶点v选择已存社区c的概率设置为:
其中,表示游走序列s中当前顶点v除外的分配给社区c的顶点数量,表示除当前游走序列s外、顶点v分配给社区c的数量。
5.根据权利要求3所述的方法,其特征在于,顶点v属于一个新社区的条件概率设置为:
其中,C+1表示一个新的社区。
6.根据权利要求4所述的方法,其特征在于,对于目标顶点vt,根据以下步骤采样负样本:
为目标顶点vt采样一个社区c;
从该社区c中采样负样本,其中,该社区c中其他顶点被视为负样本的概率设置为:
对于目标顶点vt,其负样本顶点的分布ψneg表示为:
使用多项式分布来采样负样本:
v|ψneg~Multinomial(ψneg)
其中,社区负样本顶点分布ψneg考虑顶点潜在社区的层次结构,为目标顶点采样与其所在的社区相关性较小的顶点作为负样本,Pneg(v)是顶点的不相关概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211007471.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮胎装卸用叉车
- 下一篇:基于核极限学习机模型的风电功率预测方法及装置