[发明专利]基于栈式自编码器的动态网络社团结构识别方法在审

专利信息
申请号: 201910028724.X 申请日: 2019-01-11
公开(公告)号: CN109740039A 公开(公告)日: 2019-05-10
发明(设计)人: 高超;陈正鹏;王震;李向华 申请(专利权)人: 西南大学
主分类号: G06F16/951 分类号: G06F16/951;G06F16/958
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 杨柳岸
地址: 400715*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 编码器 动态网络 栈式 社团 结构识别 模块度 矩阵 快照 人工智能 低维空间 复杂网络 节点映射 矩阵映射 聚类结果 时间平滑 时序矩阵 特征提取 网络结构 网络社团 先验信息 互信息 隐含层 构建 聚类 拟合 算法 向量 网络 并用 应用 学习
【说明书】:

发明涉及一种基于栈式自编码器的动态网络社团结构识别方法,属于人工智能与复杂网络领域。首先线性构建动态网络的时序矩阵考虑前后时刻两个快照网络结构的相关性,同时得到相应的模块度矩阵;将栈式自编码器应用到动态网络中进行特征提取,把模块度矩阵映射到低维空间中进行非线性表示学习;然后在栈中的隐含层向量中,利用k‑means算法进行聚类,并用标准互信息对结果进行评价,最后找到最优的聚类结果。本发明能够确保当前时刻网络上的社团质量。为了降低栈式自编码器过拟合的影响,增加了基于时间平滑约束的正则项。利用上一时刻网络的社团结构作为先验信息,进一步引导编码器中节点映射,从而提高网络社团识别的质量。

技术领域

本发明属于人工智能与复杂网络领域,涉及基于栈式自编码器的动态网络社团结构识别方法。

背景技术

现实生活中许多复杂系统可以用复杂网络进行刻画和建模,例如移动通信网络、社交网络、Internet网络、生物网络、交通网络等。网络中节点代表系统中的实体,边代表实体间的关系。这些网络广泛而深刻的影响着人们日常生活。网络科学主要研究不同领域中复杂系统的共性问题,以及处理这些问题的普适方法。随着网络科学研究深入,学者们发现社团结构是现实网络中广泛存在的性质,也就是说网络可以划分为若干个子网络,每个子网络内部连接紧密,而子网络间连接稀疏。社团结构的研究不仅对分析复杂网络拓扑结构、理解复杂网络功能、挖掘复杂网络中规律和预测复杂网络演化有重要意义,而且有着广泛的应用前景,如社交网络信息传播分析,城市交通流量预测,推荐算法优化等等。

虽然社团挖掘在方法和应用上取得了长足的进步,但大多都针对静态网络。实际上,几乎所有的复杂系统都具有某种动态特点,所以用动态网络对复杂系统进行模拟和刻画是一种更合理的方式。以交通网络为例,无论是公交车人流量还是出租车载客路线,在不同日期,甚至一天中不同时段都有明显差别。不同时刻的交通网络所包含的社团结构也不尽相同。动态网络下的社团挖掘因其具有揭示自然规律和探究社会现象的巨大潜力受到广泛关注。同时,动态网络的引入也对社团挖掘算法提出了新的要求和挑战。

移动通信网络也是复杂网络研究一种应用网络,随着通信技术的不断发展和移动互联网的快速普及,导致手机用户大量增加和通话记录的频繁增长。挖掘用户通话的行为模式和研究市民移动特征规律,已成为当今的热点话题。在复杂网络的背景下,应用基于网络的分析方法,可以揭示城市手机网络和居民移动网络的结构演变特征。通过对用户使用手机行为模式的社团聚集分析,可以帮助我们研究城市功能区划分和市民移动行为规律识别,了解用户行为习惯,进一步帮助施行稳定的移动基站建设,提高移动通讯系统的高效稳定。

为了解决动态网络社团结构识别的问题,现在已经提出了很多方案。根据其所采用的求解策略,可大致分为以下两种:1、基于的增量聚类方法,将动态网络看成是时间序列网络,序列中的每个网络假定为静态的。处理网络序列的方法主要又可分为两种:一种是在单一时间点上进行分析,如对每一个时间点上的网络进行社团划分,其优点是精度高,结果准确,但对每个时刻的网络重新划分导致计算代价过高;另一种是在多个时间点上进行分析,如基于前一个时刻的社团划分结果,将新增的节点归入一个已有社团,该方法的优点是充分利用之前的计算结果,计算代价低,但是对网络拓扑结构变化不敏感,结果准确率较低。还有将两种方法结合,即在少部分时间点上,重新对网络聚类,大部分时间点基于上一时间点的聚类结构进行划分。这种策略能保证一定的精度,同时降低了计算代价,但是怎样结合,即在哪些时间点进行重新聚类,还有待讨论和优化;2、基于进化聚类的方法,依据网络变化的渐进特点,进化聚类算法在对每个时刻的网络进行社团划分的同时也顾及相邻时间点网络结构冲突小的准则,既要使社团结构符合当前时刻网络结构特点,又要使当前社团划分结果与上一时刻的划分结果差异较小。引入了快照质量(snapshot quality,SQ)和历史开销(temporal cost,HC) 的概念,前者用于衡量当前社团划分结果基于当前网络的质量,后者用于衡量与前一个时间点的划分结果的差异性。目前权衡快照质量和历史开销的方法主要有四种:(1)基于随机块模型;(2)基于密度和拓扑结构;(3)基于多目标优化算法;(4)基于非负矩阵分解。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学,未经西南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910028724.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top