[发明专利]一种基于多阶邻近相似度的网络表示学习的方法有效
申请号: | 201811175451.3 | 申请日: | 2018-10-09 |
公开(公告)号: | CN109447261B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 姚文斌;张丽娟;丁元浩;杨超;樊悦芹 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06N3/0985 | 分类号: | G06N3/0985;G06F18/22;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻近 相似 网络 表示 学习 方法 | ||
本发明提出一种基于多阶邻近相似度的网络表示学习的方法。相比于传统的基于结构分析的网络表示只考虑了一阶邻近相似度和二阶邻近相似度的关系,本发明重点为节点间的高阶邻近相似度建模,分别设计了不同类别的间接邻近相似度的计算方法,尤其是考虑到了信息在网络传播过程中会随着距离的增加而衰减,因此,本发明能对当前节点的不同邻居节点进行预测,更加准确的找到与目标节点的关联度最大的邻近节点,从而能够得到语义更加丰富,具有更高的可靠性和真实性的表示向量。
(一)技术领域
本发明涉及复杂网络分析领域,具体涉及一种基于多阶邻近相似度的网络表示学习的方法。
(二)背景技术
在日常生活中,网络数据无处不在,举例来说,互联网上成千上万的网站页面构成了网页链接的网络,微博和Twitter等构成了人们社交中的人与人之间的网络,京东和天猫等构成了用户购物的网络。因此,信息网络的存在已成为我们生活中最常见的载体和形式,对信息网络的研究具有重要的学术价值和应用价值。
网络表示学习又称为网络嵌入或图嵌入,本质上是用一个低维,稠密的向量去表示网络中的节点,该向量能反应网络的结构,可以用于网络节点的聚类,分类任务,还可应用在网络中关系的预测与重构等任务中。随着机器学习和神经网络技术的发展,网络表示学习的研究也越来越重要,找到合适的网络表示数据作为输入对于神经网络的参数学习是必不可少的。
目前,网络表示学习的研究可以分为两种,一种是基于网络结构的研究,如DeepWalk,Line,node2vec等方法,一种是基于复杂网络属性的研究,结合社交网络的无标度行,社区性等。此外,还有基于内容的网络表示学习,基于时间动态性的网络表示学习,以及异质网络中的网络表示学习近年来也获得越来越高的研究热度。但上述这些方法都只是基于节点间的一阶相似性或二阶相似性,很少有再向更高阶相似性讨论的情况。尽管节点间的间接邻近关系会随着节点路径长度的增加而衰减,但节点间的间接相似度对研究节点间的趋同性关系也是十分重要的。
(三)发明内容
针对上述缺点和不足,本发明的目的在于提供一种基于多阶邻近相似度的网络表示学习的方法。
为达到以上目的,本发明的技术方案包括为:
一种基于多阶邻近相似度的网络表示学习方法,包括:
1)将网络拓扑抽象化为包含多个节点与边的网络结构图。
2)根据网络中节点间的邻近关系,对每对节点进行相似度的建模。
3)综合每个节点对的所有邻近关系,计算综合邻近相似度。
4)每个节点结合所有上下文节点的相似度关系,根据网络结构模型的算法,得到最终的节点向量的高阶表示。
所述步骤1)包括:设无向图G=(V,E)表示网络拓扑结构,其中V表示用户节点,E表示连接关系。
所述步骤2)包括:节点对间的邻近关系包括两种:直接邻近和间接邻近。具体包括以下步骤:
2.1.基于一阶相似性的直接邻近
设(B,C)为目标节点对,若B与C有直接连边,则B,C之间的路径长度为1,路径长度为1的节点间的相似度对应为一阶相似度。
一阶邻近的计算方法:
PBC=UB·UC
2.2.基于二阶相似性的间接邻近
网络一阶相似性刻画的是网络中有直接连边的局部特征,描述的信息具有片面性。且网络拓扑中的连边具有稀疏性特征,仅用直接连边的关系难以满足真实的节点趋同性关系。于是,有了二阶相似度的提出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811175451.3/2.html,转载请声明来源钻瓜专利网。