[发明专利]基于优化的复杂网络聚类方法在审
申请号: | 202011155952.2 | 申请日: | 2020-10-26 |
公开(公告)号: | CN112256935A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张成雷;韩虎;田相克;王晓杰;张登博;刘佳佳;初豪杰 | 申请(专利权)人: | 临沂大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q30/06 |
代理公司: | 济南泉城专利商标事务所 37218 | 代理人: | 季英健 |
地址: | 276000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优化 复杂 网络 方法 | ||
1.一种基于优化的复杂网络聚类方法,其特征在于,包括以下步骤:首先需要输入待聚类的文档、复杂网络、已知must-link约束集合及cnnot-link约束集合的阈值,并进行如下步骤;第一步:网络初始化
网络初始化是将复杂网络中的数据抽象成无向图,并将无向图转化成N阶矩阵A,并随机选择簇的数目k,并赋予网络的初始值,网络的初始值指的是节点和边的基本信息和属性;
第二步:抽取特征向量权值
假设特征词的权重为ft,则计算文档各关键词的特征向量权重Wi为Wi=σ×μ×ft×log(l+1),其中σ是特征词位置的加权系数,μ是语义分析加权系数,ft是文档中关键词的频率,l是关键词特征之间的长度;
第三步:构造节点对集合
根据约束规则,比较must-link节点对集合、cannot-link节点对集合,并判断关键词之间是否符合服务资源同义词字典集和属性字典的扩展要求,计算得出各种先验知识,先验知识指代的是合理性形式;
第四步:构造概念
根据must-link节点对集合、cannot-link节点对集合的约束规则,构建所有的概念C,并选择重要的概念Ci进行计算,计算如下:∪Cig=Ci∪Cim=M,其中M是概念的集合,Ci是第i个概念,Cig是第i个概念的对象,Cim表示概念集M所属的属性;将节点对集合进行抽取特征所有概念,并按照对象进行排列;
第五步:概念做归一化处理
对所有的概念C=(C1,C2,...,Cn)的特征进行归一化处理,并依次输入概念C的数据并抽象成无向图,归一化公式计算如下:
第六步:计算节点对间的距离度量
对平滑假设距离度量进行计算,具体公式如下:根据获取的先验知识,通过平滑假设距离度量计算出两节点之间的度量,形成样本数据中术语节点的距离范围,由此判断衍生的节点对是否超出范围,并根据矩阵式的数据进行修正以确定衍生的先验知识集合节点对的位置;
第七步:计算边界值
若边界值为0,则标记完成后删除所有边界值为0的边,并且同时计算复杂网络中除去边界值为+∞边的剩余边边界值;所述边界值的定义式为:其中σst(m)表示经过节点m的s→t的最短路径数,σst表示s→t的最短路径数;
第八步:计算模块复杂度
在计算网络中边的边界值和删除边时,计算网络的模块度Q用以确定范围的终止范围,其计算公式如下:Q=∑i=0(eij-aij)2,其中eij是k阶对称方阵E的元素,1≤i,j≤k,aij则是复杂网络中社区i节点连接的边数与所有社区的边数的比值;
第九步:重复第六步、第七步,直至所有边被删除,得出复杂网络的分类结果。
2.根据权利要求1所述的基于优化的复杂网络聚类方法,其特征在于:所述第一步中N阶矩阵可通过以下方式定义:假设定义源节点S的距离为ds=0,权值是ws=1,则N阶矩阵A的表达式为矩阵A中点aij的值表示两节点之间是否有连边,无连边时标记为0,有连边时标记为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于临沂大学,未经临沂大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011155952.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种线缆剥皮机
- 下一篇:一种敏捷开发中数据恢复方法及系统