[发明专利]一种错误累积敏感的增量式动态社区发现方法及系统有效
申请号: | 201810481373.3 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108833138B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 王志晓;袁冠;席景科;孟凡荣;牛强;芮晓彬;何婧 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;G06Q50/00 |
代理公司: | 北京天达知识产权代理事务所(普通合伙) 11386 | 代理人: | 龚颐雯;马东伟 |
地址: | 221116 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 错误 累积 敏感 增量 动态 社区 发现 方法 系统 | ||
本发明涉及一种错误累积敏感的增量式动态社区发现方法及系统,其中,方法包括:计算给定动态社交网络的错误累积最佳阈值;在第一个时间片,采用静态方法获得动态社交网络的初始社区结构;从第二个时间片开始直到结束,判断当前时间片的错误累积预估值是否超过错误累积最佳阈值,是,则重新进行社区划分,获得当前时间片社区结构;否,则动态更新增量节点的社区归属,获得当前时间片的社区结构。本发明充分考虑了传统增量式动态社区发现中存在的错误累积现象,对每个时间片的错误累积进行了预估,并根据错误累积预估结果选择合适策略进行社区发现,在确保社区发现效率的基础上,提高了社区发现的准确性。
技术领域
本发明涉及网络分析技术领域,尤其是一种错误累积敏感的增量式动态社区发现方法及系统。
背景技术
许多社交网络中都隐藏着社区结构,社区内的用户联系紧密,而社区之间的用户联系较为稀疏。然而,随着时间的推移,社交网络会发生变化,仅仅对社交网络进行静态社区划分已经不足以刻画其结构特性,因此出现了动态社区划分方法。
目前,常见的动态社区发现方法分为独立静态式划分、基于演化聚类的划分和增量式划分。增量式划分是一种高效的动态社区划分方法,该类方法认为,在社交网络变化过程中,大部分拓扑结构是稳定的,仅有小部分结构会出现变化,以前一个时间片的社区结构为基础,动态更新增量节点的社区归属,即可获得当前时间片的社区结构。增量式划分方法在增量更新过程中难免会出现社区划分错误,并且前一个时间片的错误可能会导致后一个时间片更多的错误出现,造成错误累积。传统增量式动态社区发现方法忽略错误累积现象,影响了动态社区发现的性能。
发明内容
鉴于上述的分析,本发明旨在提供一种错误累积敏感的增量式动态社区发现方法及系统,用于解决现有增量式动态社区发现方法由于忽略错误累积而导致社区划分性能逐渐下降的问题。
本发明的目的主要是通过以下技术方案实现的:
一种错误累积敏感的增量式动态社区发现方法,包括以下步骤:
根据给定的动态社交网络,预估第一个时间片后所有时间片的错误累积,计算所述动态社交网络的错误累积最佳阈值;
在第一个时间片,采用静态方法对初始时间片进行社区划分,获得动态社交网络的初始社区结构;
从第二个时间片开始直到结束,判断当前时间片的错误累积预估值是否超过错误累积最佳阈值,否,则重新进行社区划分,获得当前时间片社区结构;是,则动态更新增量节点的社区归属,获得当前时间片的社区结构。
进一步地,所述错误累积最佳阈值的计算方法包括:
预估第一个时间片后每个时间片的错误累积;
针对预设的动态社交网络的错误累积阈值序列,基于每个时间片的错误累积,分别计算社区划分准确性和时间消耗的杠杆值LOCT;选取LOCT最大值对应的错误累积阈值,为动态社交网络的错误累积最佳阈值。
进一步地,所述错误累积的预估公式为:其中,IEAt表示预估的当前时间片t的错误累积,t0为最近一次采用静态方法划分社区的时间片,ΔNi表示从t0开始的第i个时间片的增量节点个数,Ni表示所述第i个时间片的节点总数。
进一步地,所述杠杆值LOCT的计算公式为:
其中,t为当前时间片,T为总时间片数,CCt为第t个时间片和最近一次采用静态方法重新划分社区结构的时间片之间的相关系数,freq为采用静态方法重新划分社区结构的次数,ratio为比例系数;
所述相关系数CCt的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810481373.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音情感识别装置
- 下一篇:一种模件检测剔除装置