[发明专利]一种基于生成对抗网络模型的多层学术网络社区发现方法、系统有效
申请号: | 201911393726.5 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111210002B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 李建欣;孙庆赟;傅星珵;朱时杰;季诚;董翔宇 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 生成 对抗 网络 模型 多层 学术 社区 发现 方法 系统 | ||
本发明实现了一套基于生成对抗网络模型的多层学术网络社区发现方法及其系统,基于GAN模型学习多层网络的嵌入表示,通过构建多层学术网络;使用生成对抗模型学习节点嵌入表示:生成器生成层内节点对和层间节点对作为伪样本,判别器判别数据是否为真实数据分布;生成器和判别器迭代更新进行对抗学习;使用基于K‑means聚类的方法发现社团的步骤,实现对于网络来源的学者信息的处理,发现其中多层网络结构所能提供的关系网络的深层信息,并使其算法和系统更具有鲁棒性。
技术领域
本发明涉及人工智能领域,尤其涉及一种基于生成对抗网络模型的多层学术网络社区发现方法和系统。
背景技术
随着科学研究多样化的发展,学术合作逐渐向跨地区、跨学校、跨研究领域的方向发展,科研合作的广泛性和复杂性也使得学术团队的数量和规模日益增大。对学术团队的研究能够发现各学科人才之间的合作趋势,也可以为具体课堂或项目的实施提供人才支持。学者之间通过各种关系(例如合著关系、引用关系、同事关系等)构成一个庞大且复杂的网络,因此可通过对多层网络的社区发现来发掘不同关系和不同规模的学术团队。
学术团队的研究可以抽象为社团,而社团是网络的基本结构性质之一,社团之间的连接稠密,社团外的连接相对稀疏。社团发现算法就是研究网络具有的社团结构。目前主流的社团划分算法包括基于模块度的、基于标签传播的、基于聚类思想等方法。随着多层网络的研究发展,出现了很多多层网络社团发现算法,如基于多层粒子群的社团发现算法、多层网络局部社团发现算法、基于比较节点度之间的关系发现局部社团结构等。其中,基于聚类的算法通过数据点之间的相似度来发掘社团,通过控制聚类算法的参数,可以获得不同规模的社团,因此在本发明中,采用基于聚类的方法,以发现不同规模的学术团队。
近年来,多层网络嵌入方法(Multilayer Network Embedding,MNE)因其相比传统的编码表示更简洁的表示形式和综合性能,已经吸引了大量的关注。它已被应用于图结构数据挖掘的下游任务,比如节点分类、连接预测、社区检测、推荐系统等。
MNE的训练通常是基于给定多层网络结构数据,将节点的信息嵌入在高维空间,然后应用到下游的任务。多层网络中节点通过多种关系连接,因此,MNE 提供的节点嵌入需要保留多种关系信息。此外,现有方法大多基于特定策略选取节点的邻居,通过聚集邻居信息对节点进行嵌入表示。然而,在数据集中出现的节点是有限的,仅通过聚合数据集中存在的节点信息进行嵌入表示不能有效学习节点的潜在分布,鲁棒性较差。
在本发明中,我们考虑以生成式方法学习多层网络嵌入表示的问题。特别的,由于其在复杂分布上优秀的无监督学习能力,我们采用基于生成对抗网络 (GenerativeAdversarial Network,GAN)进行节点嵌入表示学习。Ian J. Goodfellow等人于2014年提出了一个通过对抗过程估计生成模型的新框架。框架中同时训练两个模型:捕获数据分布的生成模型G,和估计样本来自训练数据的概率的判别模型D,二者通过互相博弈学习产生更好的输出。G的训练程序是将D错误的概率最大化。这个框架对应一个最大值集下限的双方对抗游戏。可以证明在任意函数G和D的空间中,存在唯一的解决方案,使得G重现训练数据分布,而D=0.5。在G和D由多层感知器定义的情况下,整个系统可以用反向传播进行训练。在训练或生成样本期间,不需要任何马尔科夫链或展开的近似推理网络。因此,为解决多层网络嵌入学习问题,我们选择GAN模型,因为它能学习节点的潜在分布,有利于生成更具有鲁棒性的嵌入表示。
发明内容
学者间复杂的关系可表示为一个多层网络,而当前多层网络嵌入表示模型的鲁棒性需要进一步提高。
学习网络的嵌入表示,一个关键的问题是如何在高维空间中将节点分布保留下来。在模型训练中,通过负采样的方式,在原始网络中随机选择节点获得负样本,只能可以对已有样本进行有效学习,不能学习样本的潜在分布。
此外,多层网络中,节点存在着多种关系,既要针对不同的关系生成节点的嵌入表示,在节点的多种嵌入表示之间也需要存在一定的一致性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393726.5/2.html,转载请声明来源钻瓜专利网。