[发明专利]一种基于异质网络表示学习的链路预测方法在审
申请号: | 202010106260.2 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111325326A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 管戈;蒋宗礼 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F40/30;G06Q50/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 表示 学习 预测 方法 | ||
本发明公开了一种基于异质网络表示学习的链路预测方法,属于网络分析领域;通过基于元路径的随机游走捕获异质网络的结构和语义,生成训练序列;应用训练序列训练skip‑gram模型以此来学习网络特征,将网络节点映射到低维向量;通过对节点向量的相识度处理得到链路预测结果;本发明解决了当前多数链路预测算法无法应用在异质网络的情况,可以获取异质网络不同节点所蕴含的丰富信息。大多预测基于邻域局部信息和结构特征,对网络的聚集系数要求较高,稀疏网络预测效果较差,本发明基于元路径的随机游走,可用于稀疏网络,本发明通过对网络整体学习统一建立节点向量,简化计算。
技术领域
本发明属于网络分析领域,涉及一种链路预测方法,尤其涉及一种基于异质网络表示学习的链路预测方法。
背景技术
现实世界中存在大量的复杂系统都可以抽象成网络形式来体现,所以近些年对网络的研究成为多个学科和领域的研究热点。而在大数据时代,随着大量社交网络和信息网络的出现,使得链路预测的研究与网络的结构与演化紧密联系起来。与此同时,链路预测的研究也可以从理论上帮助认识复杂网络演化的机制。所以,链路预测已经成为数据挖掘研究的一个重要方向。
但当前对于链路预测的研究存在一些问题。一方面,当前研究主要针对同质信息网络,这种网络只含一类节点和一类连接即所有节点类型是相同的。现实中大多数网络是异质的,包括社交网络在内,网络中包含了多种类型的节点,不同类型的节点组成了不同类型的连接。这些不同类型的节点和连接构成了一个富含语义信息和结构特征的网络。显然对异质网络的链路预测对于链路预测本身以及复杂网络研究的理论基础的建立和完善,可以起到推动和借鉴的作用。另一方面,大多链路预测方法基于邻域局部信息和结构特征,对网络的聚集系数要求较高,稀疏网络预测效果较差,且复杂度较高对大规模网络不友好。
本发明是基于异质网络表示学习的一种链路预测方法。这种方法既解决了当下多数链路预测方法无法获取异质网络不同节点类型和连接类型所蕴含的丰富信息,又通过网络表示的方式获取网络整体结构,降低了算法的复杂性。
发明内容
本发明的目的在于提出一种基于异质网络表示学习的链路预测方法,该方法主要分为三个部分:通过基于元路径的随机游走捕获异质网络的结构和语义,生成训练序列;应用训练序列训练skip-gram模型以此来学习网络特征,将网络节点映射到低维向量;通过对节点向量的相识度处理得到链路预测结果,实验使用DBIS(Database and InformationSystems)数据集。具体步骤如下:
步骤(1)提取节点建立标识;
从数据集中提取作者,文章,会议三种节点类型,并分别建立id用于标识。在处理连接关系和随机游走时把id作为唯一标识,获取具体内容需要查询映射表。
步骤(2)提取连接边和隐藏关系;
从数据集网络中提取作者与论文的关系,论文与会议的关系作为构建网络的基本关系。根据基本网络关系提取出两种隐藏关系,定义多名作者共同发表同一篇文章为作者和作者之间的关系,作者是否在某一会议上发表过文章为作者与会议的关系。在此基础上选择90%的连接作为训练集,将剩余的10%的连接作为测试集。
步骤(3)通过基于元路径的随机游走生成序列;
选取作者-论文-会议-论文-作者作为元路径。按转移概率在经步骤(1)、(2)处理得到的网络中进行随机游走产生游走序列。通过walk-length参数来调整产生序列的长度。
步骤(4)训练skip-gram模型;
直接将步骤(3)中通过随机游走产生的序列输入到skip-gram模型进行训练,获取每个节点的向量表示,通过dimensions参数调整向量维度。
步骤(5)节点相似性分析;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010106260.2/2.html,转载请声明来源钻瓜专利网。