[发明专利]一种自适应融合网络拓扑和节点内容的社团发现方法在审
申请号: | 202110698553.9 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113378075A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 曹金鑫;贾焱鑫;许伟忠;陈翔;丁卫平;张晓峰 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 融合 网络 拓扑 节点 内容 社团 发现 方法 | ||
本发明公开了一种自适应融合网络拓扑和节点内容的社团发现方法,属于复杂网络分析技术领域,该方法挖掘社交网络数据集中社团结构,运用节点社团隶属度和图正则项分别建模网络拓扑和节点内容,然后引入自适应因子对所述网络拓扑和节点内容进行融合,以构建基于图正则化的自适应社团检测模型;最后使用评价算法归一化互信息熵评估模型有效性。本发明的有益效果为:利用自动编码器以及图正则整合了网络拓扑和节点内容,另一方面引入自适应因子缓解了社团发现过程中网络拓扑和节点内容的不匹配性。
技术领域
本发明涉及复杂网络分析技术领域,涉及一种自适应融合网络拓扑和节点内容的社团 发现方法。
背景技术
在真实的社交网络生活中,存在着大量的网络化数据集,例如社交网络、通信网络等, 它们通常可形式化为复杂网络。对于复杂网络的分析,找到由密集连接的节点组成的社区 非常重要。通常,在分析社交网络时,社团发现可以帮助找到兴趣和目的相似的用户组, 并预测属于社区的用户的行为。复杂网络同时包含了网络拓扑和丰富的内容信息,这些内 容信息可辅助网络拓扑以提高社团发现的能力。但是,在真实网络场景中,网络拓扑与节 点内容信息所刻画的社团结构上存在不匹配性。这使得融合的节点内容信息可能与网络拓 扑在社团发现过程中存在相悖的作用,出现融合网络拓扑和节点内容的社团发现执行能力 低下的结果。如何有效地挖掘具有内容网络、网络拓扑与节点内容不匹配的社团结构,亟 需一种新的社团发现方法。
发明内容
本发明提供了一种自适应融合网络拓扑和节点内容的社团发现方法,主要是针对社团 发现中网络拓扑和节点内容之间的不匹配性以及社团的表征能力不足的技术问题而提出 的,本发明针对不匹配性,引入自适应因子作为融合网络拓扑和节点内容的平衡因子,以 缓解这两种信息不匹配时仍可提高社团发现的质量;基于自动编码器框架构建的模型,利 用其神经网络学习非线性表征,以提高社团隶属度表征社团结构的能力,对融合网络拓扑 和节点内容社团发现理论扩展以及良好应用价值。
本发明的思想为:首先,获得描述网络拓扑的节点之间链接、描述节点内容信息的节 点上文本特征等数据;然后,分别对网络拓扑、节点内容进行矩阵化处理,并分别进行模块度转化和相似度转化;接着,我们基于自动编码器和非负矩阵分解理论相似性,以及利用图正则化描述属于相同社团的节点的内容具有相似的假设,同时引入自适应因子平衡拓扑和内容融合比例,构建自适应融合网络拓扑和节点内容的社团发现模型;最后,通过模型优化推导出模型参数,对模型参数进行聚类,运用评价算法计算聚类结果和原始社团结构近似程度,以评估模型的性能。
本发明所采用的技术方案是:一种自适应融合网络拓扑与节点内容的社团发现方法, 所述方法包括以下步骤:
S1、带有内容信息的复杂网络数据表示为G=(V,E,Q),其中V={v1,v2,…,vn} 表示节点的集合,E={e1,e2,…,em}表示边的集合,Q表示节点内容的特征向量集合;
S2、形式化构建网络拓扑和节点内容信息;
S3、运用节点社团隶属度和图正则项分别构建网络拓扑和节点内容,分别对应该方法 的模型中两个子模型,基于网络拓扑和节点内容不匹配性构建自适应因子;
S4、使用步骤S3所述的两个子模型和自适应因子在统一框架下结合为一个模型,并在 数据集上对其进行验证,使用归一化互信息熵作为评估算法对统一模型的有效性进行评价。
本发明提供的一种自适应融合网络拓扑与节点内容的社团发现方法进一步优化方案, 所述步骤S2具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110698553.9/2.html,转载请声明来源钻瓜专利网。