[发明专利]一种复杂网络中社区个数估计方法在审
申请号: | 202210053504.4 | 申请日: | 2022-01-18 |
公开(公告)号: | CN114385928A | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 李凝思;李东 | 申请(专利权)人: | 李凝思 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06Q50/00 |
代理公司: | 广州市智远创达专利代理有限公司 44619 | 代理人: | 蔡国;沈婉婷 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 网络 社区 个数 估计 方法 | ||
1.一种复杂网络中社区个数估计方法,其特征在于,该方法包括如下步骤:
1.1、给服务器输入网络数据D用于社区个数估计;
1.2、服务器对网络数据D采用第一算法进行网络嵌入,然后使用第二算法将网络嵌入聚成指定数量的类簇,其中,每一个类簇分别对应一个社区,重复对本步骤n次,以得到社区数为1到n为序列号的一系列社区划分h;
1.3、计算任意两个相邻社区之间的平均互信息,并最终获得序列号1到n中的相邻社区划分中的所有平均互信息I的结果列表;
1.4、计算每个社区划分中社区的每个节点的访问概率以及不同社区之间的跳转概率,从而得到对应社区划分的所有信息熵E的结果列表;
1.5、根据如下公式计算社区个数K即可,公式如下:
K=argmax{[IK(D;h)]-EK[I(h)]} 公式(1)
在公式(1)中,IK(D;h)为I的结果列表的序列号为K时的最大平均互信息,EK[I(h)]为E的结果列表的序列号为K时的最小信息熵。
2.根据权利要求1所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.2中,预先定义初始化计数为i,聚类结果集为p,并且,初始化计数值i=0,聚类次数为n,所述步骤1.2还包括:
1.2.1、将初始化计数值i与聚类次数n进行比对,当i大于或者等于n时,执行步骤1.3;当i小于n时,执行如下步骤:
1.2.2、服务器对网络数据D采用第一算法进行网络嵌入;
1.2.3、通过第二算法将步骤1.2.2的网络嵌入聚成i+1类的类簇,从而得到数量为i+1的聚类结果集p,并以此循环,进而得到社区数为1到n为序列号的一系列社区划分h的聚类结果集p。
3.根据权利要求2所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.3中,令i=0,准备计算社区数为1到n为序列号的一系列社区划分h的相邻划分间的平均互信息I的结果列表I1、I2......In,将i与n-1进行比对:
1.3.1、当i大于或者等于n-1时,得到最终的平均互信息I的结果列表,执行步骤1.4;
1.3.2、当i小于n-1时,计算相邻两个社区划分之间的平均互信息,并以此循环,进而获得序列号1到n的社区划分h的最终平均互信息I的结果列表,再执行步骤1.4。
4.根据权利要求3所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.3中,从社区数为1到n为序列号的一系列社区划分h的聚类结果集p提取任意节点数据,通过如下公式计算平均互信息I:
ωij=P(Xi,Yj) 公式(3)
其中,I(Xi;Yj)为社区Xi和社区Yj的互信息,P(Xi,Yj)为社区Xi和社区Yj的关联性,n为网络中节点总数,为社区Xi和社区Yj共同节点的数量。
5.根据权利要求3所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.4中,其还包括如下步骤:
1.4.1、通过预设的随机游走算法来计算每个划分社区h的每个节点的转移概率矩阵M;
1.4.2、令i=0,准备利用各转移概率矩阵M内的每个划分社区的每个节点的访问概率以及不同划分社区之间的跳转概率进行计算,从而得到序列号1到n的划分社区h的信息熵E的结果列表E1、E2......En;
1.4.3、将i与n进行比对,当i大于或者等于n时,执行步骤1.5,反之,当i小于n时,计算每个社区划分h的信息熵,以此循环,进而获得序列号1到n的划分社区h的最终信息熵E结果列表,再执行步骤1.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李凝思,未经李凝思许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210053504.4/1.html,转载请声明来源钻瓜专利网。