[发明专利]一种基于邻居信息的网络表示学习方法及系统在审
申请号: | 201810180927.6 | 申请日: | 2018-03-05 |
公开(公告)号: | CN108537342A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 纪守领;杜天宇;陈建海 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N99/00 | 分类号: | G06N99/00;G06Q50/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络表示 网络节点 邻居信息 向量表示 学习系统 目标函数 学习 目标函数构建 目标函数优化 数据输出模块 数据输入模块 网络信息数据 构造网络 关联信息 节点向量 随机梯度 网络结构 下降算法 初始化 稀疏性 低维 构建 输出 优化 网络 | ||
本发明公开了一种基于邻居信息的网络表示学习系统,包括:数据输入模块,将含各个网络节点关联信息的网络信息数据集输入所述的网络表示学习系统,构建并初始化各个网络节点的低维向量表示;目标函数构建模块,根据网络的一度关系和邻居信息构造网络的目标函数;目标函数优化模块,采用随机梯度下降算法对目标函数进行优化,得到各网络节点的最优向量表示;数据输出模块,输出学习到的网络节点的最优向量表示。本发明还公开了利用网络表示学习系统进行网络表示学习的方法。本发明的网络表示学习方法充分利用网络节点的邻居信息,可以解决网络结构一度关系稀疏性的问题,进而学习出更有代表性的节点向量。
技术领域
本发明涉及网络表示学习技术领域,尤其涉及一种基于邻居信息的网络表示学习方法及系统。
背景技术
真实世界中的实体互相交互形成了大规模复杂网络。传统的网络分析技术将每个网络节点看作唯一的符号,这种方法存在的稀疏性问题极大地影响了个性化推荐、异常检测等问题的效果。为了克服稀疏性问题,针对复杂网络分析的表示学习方法被提出。网络表示学习是将大规模网络中节点的信息编码到一个低维空间中,这种低维表示可以用来判断节点之间的距离远近、有无关系等,还可以作为分类和聚类等任务的特征向量。
对于真实世界中的网络,节点往往拥有其他的附加信息。例如,在真实世界的电商平台中,一些卖家为了提升店铺的排名和销量通常会雇佣水军来进行刷单,恶意的刷单用户和正常的普通用户之间通常会形成一种群聚关系,即刷单用户与刷单店铺进行交易的比例占刷单用户总交易笔数较大,而普通用户与刷单店铺进行交易的比例占普通用户总交易笔数较小。这种群聚关系将他们约束在一个相似的群体中,利用这种关系可以解决网络结构一度关系稀疏性的问题,进而学习出更有代表性的节点向量以便进行后续的一些分析工作,例如识别恶意买家和卖家等。目前已有的工作,并没有将这种邻居信息考虑到表示向量的学习当中。
因此,同时考虑网络结构信息以及邻居信息对于学习更好的节点表示是十分必要的。
发明内容
本发明提供了一种基于邻居信息的网络表示学习方法,该方法可以充分利用已有信息,提高网络节点表示的质量。
本发明提供了如下技术方案:
一种基于邻居信息的网络表示学习方法,包括以下步骤:
(1)构建包含各个网络节点关联信息的网络信息数据集,所述关联信息用于表示网络的结构,构建并初始化各个网络节点的低维向量表示;
(2)根据网络的一度关系和邻居信息构造网络的目标函数;
(3)采用随机梯度下降算法对目标函数进行优化,得到各网络节点的最优向量表示;
(4)输出学习到的网络节点的最优向量表示。
在网络中,如果两个节点之间存在边,那么这两个节点就互为邻居。
本发明的网络表示学习方法结合网络节点的网络结构信息及邻居信息,充分利用网络节点的邻居信息,可以解决网络结构一度关系稀疏性的问题,进而学习出更有代表性的节点向量,以便进行后续的一些分析工作,如分类、聚类、推荐等。
本发明的网络表示学习方法适用于同构网络和异构网络两种不同类型的网络结构,具有较好的扩展性。
步骤(2)中,所述的目标函数通式为:
其中,为一度关系目标函数;为邻居信息目标函数;α为常数,表示背景向量的影响系数。背景向量的影响系数可根据具体的实际需要进行设定。
所述的通式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810180927.6/2.html,转载请声明来源钻瓜专利网。