[发明专利]基于变分自编码器的动态网络嵌入链接预测方法有效
申请号: | 202011344120.5 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112446489B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 荆鑫 | 申请(专利权)人: | 天津大学 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/0442;G06N3/0464;G06N3/049 |
代理公司: | 天津铂茂专利代理事务所(普通合伙) 12241 | 代理人: | 陈晓蕾 |
地址: | 300073*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编码器 动态 网络 嵌入 链接 预测 方法 | ||
本发明公开了基于变分自编码器的动态网络嵌入链接预测方法,包括以下步骤:S1:获取一段时间的学术网络或社交网络数据流,按照一定时间细粒度进行数据预处理;S2:利用变分自编码器建立编码‑解码框架,对每个时间切片的网络数据进行编码得到低维向量;S3:利用当前网络中节点间的邻居关系,对网络中每一个节点输出的低维向量施加自注意约束。本发明中,通过通过挖掘原始网络与隐向量之间的潜在关系,发现动态网络演化的核心机理,有效的利用了网络在空间和时间上的信息,弥补传统静态方法的不足,并对自编码器生成的中间隐含向量施加约束,实现有效利用网络的空间信息和时间信息。
技术领域
本发明涉及深度学习模型方法技术领域,尤其涉及基于变分自编码器的动态网络嵌入链接预测方法。
背景技术
复杂系统可以表示为网络,如蛋白质网络、社交网络、通信网络和联合作者网络,网络分析的子任务通常包含节点分类、社团发现、链接预测、推荐系统等。网络表征学习或网络嵌入是通过将高维原始网络映射到低维空间中以降低原始网络的复杂度并提高下游任务的研究效率,而动态网络的表征学习可以利用网络的历史信息来预测下一时刻网络的演化。
对复杂网络的表征学习可以通过矩阵分解、随机游走和深度学习三种方法,将一个高维的原始网络映射到一个低维的特征空间以降低网络复杂度。近年来,基于静态网络的网络嵌入方法已经提出了许多,可以对网络的拓扑结构进行表征学习,从而获得一组表示性更好的隐向量。
然而在现实世界中,网络往往是动态演化的,只关注某个静态时刻的网络往往会忽视网络的演化性,使得应用场景偏窄。基于此,一些动态网络的表征学习方法更加关注网络的演化,使得在动态场景下模型的分类、链接预测等效果优于传统静态方法,这些动态方法弥补了静态方法对网络变化描述的不足,但是仍然没有解释出网络演化的本质机理,也没有找到原始网络与隐向量之间的本质关联。
发明内容
本发明的目的在于提供基于变分自编码器的动态网络嵌入链接预测方法,以解决现有技术中的上述不足之处。
为了实现上述目的,本发明采用了如下技术方案:基于变分自编码器的动态网络嵌入链接预测方法,包括以下步骤:
S1:获取一段时间的学术网络或社交网络数据流,按照一定时间细粒度进行数据预处理;
S2:利用变分自编码器建立编码-解码框架,对每个时间切片的网络数据进行编码得到低维向量;
S3:利用当前网络中节点间的邻居关系,对网络中每一个节点输出的低维向量施加自注意约束;
S4:将上一时刻输出的低维向量结合当前网络拓扑结构输入LSTM网络,得到更新的低维向量;
S5:对获得的低维向量进行解码,还原为重构的下一时刻网络,以实现链接预测。
作为上述技术方案的进一步描述:
所述S1中获取一段时间的学术网络或社交网络数据流,按照一定时间细粒度进行数据预处理,具体包括以下步骤:
S1.1:通过网络日志形式获取每天的网络结构图,以及通过一段时间内科学杂志摘要的作者信息获得作者之间的社交网络,再分割成每天的网络结构图;
S1.2:使用随机块模型,设计规则生成虚拟的网络拓扑图。
作为上述技术方案的进一步描述:
所述S2中利用变分自编码器建立编码-解码框架,对每个时间切片的网络数据进行编码得到低维向量,具体包括以下步骤:
S2.1:设计自编码器的隐藏层数量与神经元数目,定义变分自编码器的模型代价函数,包括重构损失与KL散度损失两项;
S2.2:利用重参数技巧使模型可以通过梯度下降方式进行反向传播。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011344120.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种板栗脱苞机械装置
- 下一篇:一种基于航行大数据的船舶主机油耗动态预估方法