[发明专利]一种基于网络链接和节点属性信息的节点嵌入方法在审
申请号: | 202011319384.5 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112286996A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 单虹毓;杜朴风;焦鹏飞;金弟 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 张建中 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 链接 节点 属性 信息 嵌入 方法 | ||
本发明公开了一种基于网络链接和节点属性信息的节点嵌入方法,该方法包括:构建由图自编码器、先验生成模型和网络导向约束模块构成的神经网络模型;图自编码器将网络数据映射到隐变量空间中,生成隐变量空间分布函数;先验生成模型将隐变量空间分布通过归一化流模型映射到高斯分布并生成新变量;其基于隐变量与新变量间的kl散度,优化和更新两者空间分布,其将隐变量的多个空间分布函数组合成一组合分布函数;网络导向约束模块通过拉普拉斯特征映射方式对组合分布函数进行约束;采用训练完成的模型对网络数据进行处理,得到节点特征参数,将节点特征参数与该网络数据相结合,形成带有节点特征参数的网络数据。本发明能够获得高质量的节点表示。
技术领域
本发明涉及数据挖掘领域,特别涉及一种基于网络链接和节点属性信息的节点嵌入方法。
背景技术
目前,在数据挖掘领域网络嵌入是一个重要的任务。它是许多网络分析任务的基础,例如节点群集,节点分类和图形可视化。网络嵌入旨在学习每个节点的低维潜在表示,同时保留网络中节点之间的关系。近年来,已经提出了各种网络嵌入方法。其中基于拓扑的方法认为只能获取网络的拓扑信息,网络嵌入通常的方法是保留尽可能多的拓扑信息;除了拓扑信息之外,网络的属性信息也被认为是网络嵌入的有用来源。许多网络嵌入方法使用这两种类型的信息来提高网络嵌入的质量,例如随机游走、矩阵分解、深度学习等。尤其是采用深度学习技术的自动编码器,其工作原理是学习数据的编码并从解码中重建数据,其在处理大规模网络时具有可伸缩性的优点。由于网络嵌入的目标是探索和保留原始数据的潜在结构,目前带有节点语义信息的网络数据通常是高维且复杂的,因此基于自编码器的方法很难发现数据的某些深层信息。为了解决这个问题,现有的改进方法采用变分自动编码器,该方法是通过向自编码器引入了一个潜在变量模型,假设由编码器压缩的潜变量遵循一定的先验分布,可以通过观察到的数据来推断该分布参数。但是,现有的变分自编码器模型通常允许潜在变量遵循固定分布,例如高斯分布,但是实际网络通常具有许多复杂的结构特性,例如:一阶/二阶接近度、高阶接近度(例如主题和共同体)、幂律等,它们表达了多峰特征,现有的变分自编码器模型无法挖掘这些不符合固定分布的潜在变量信息。
发明内容
本发明为解决公知技术中存在的技术问题而提供一种基于网络链接和节点属性信息的节点嵌入方法。
本发明为解决公知技术中存在的技术问题所采取的技术方案是:一种基于网络链接和节点属性信息的节点嵌入方法,该方法为:构建由图自编码器、先验生成模型和网络导向约束模块构成的神经网络模型;图自编码器用于将包括网络链接和节点属性信息的网络数据映射到隐变量空间中,对应生成隐变量的空间分布函数;先验生成模型,其用于将隐变量的空间分布通过归一化流模型映射到高斯分布并生成新变量;其计算隐变量分布函数与新变量分布函数之间的kl散度,并基于kl散度,优化和更新隐变量及新变量的空间分布,得到对应隐变量的多个空间分布函数,其将得到的多个空间分布函数组合成一个组合分布函数;网络导向约束模块用于通过拉普拉斯特征映射方式对组合分布函数进行约束;采集包括已知网络链接和节点属性信息的网络数据,制成样本集,从样本集中抽取网络数据样本和相应的邻接矩阵,对神经网络模型进行训练;采用训练完成的神经网络模型对未知网络链接和节点属性信息的网络数据进行处理,得到对应该网络数据的节点特征参数,将节点特征参数与该网络数据相结合,形成带有节点特征参数的网络数据。
进一步地,该方法还包括:将所得节点放入分类器中进行训练,并将训练好的节点嵌入网络数据中进行可视化表示。
进一步地,采用Adam优化器来最小化神经网络模型的损失函数,并优化神经网络模型的参数。
进一步地,对神经网络模型进行训练时,随机初始化参数,利用Adam优化器优化所得的参数更新规则建立模型训练过程,将网络数据样本放入神经网络模型中训练,不断迭代,直至参数更新收敛。
进一步地,该方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011319384.5/2.html,转载请声明来源钻瓜专利网。