[发明专利]一种基于多规则聚类的组件识别方法有效
申请号: | 201810221525.6 | 申请日: | 2018-03-17 |
公开(公告)号: | CN108519881B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 王璐璐;张叶炼;孔祥龙;李必信 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F8/41 | 分类号: | G06F8/41;G06K9/62 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多规则聚类的组件识别方法,通过对模块依赖图的分析,根据制定的规则,分别从依赖类型、依赖结构和依赖强度多个角度识别出组件,同时并分析组件间的依赖关系。同时本发明采用了中心‑层次混合聚类算法,对于聚合的判定基于一个度量标准D(a,b)。该值受到两个因素影响,分别是实体间的目录相似度,以及实体间的依赖强度,其中依赖强度又和依赖次数与依赖类型有关。在每次迭代后,围绕选取的聚类中心进行层次聚合,最后实现对目标系统由低层到高层的抽象。 | ||
搜索关键词: | 一种 基于 规则 组件 识别 方法 | ||
【主权项】:
1.一种基于多规则聚类的组件识别方法,其特征在于,所述方法包括如下步骤:步骤1):遍历依赖图找到符合强依赖类型,包括继承、实现、组合、定义与实现的实体集并聚合;步骤2):寻找符合强依赖结构的实体集并聚合,形成实体集,处理完毕得到的结果就是模块依赖图;步骤3):根据相似算法对2)得到的模块依赖图进行距离计算,如下公式用于描述两个实体或实体集之间的距离公式,D(a,b)值越大,距离越短;D(a,b)=DirSim(a,b)*DependComab其中,DirSim(a,b)表示实体集间的目录相似度,DependComab表示实体集a依赖实体集b的依赖强度;步骤4):通过计算依赖频次来判断依赖密集的组件,聚合这些具有较高的耦合度的组件;步骤5):根据步骤2)得到的模块依赖图,根据出入边寻找K个聚类中心,进行排序,选出出入度总数前k的模块;步骤6):根据3)计算的相互间距离,比较并找到距离聚类中心最近的模块,并预判聚合操作是否会引入新的耦合组件,以及对于新的组件进行规模预判;步骤7):找到距离聚类中心最接近的两个模块执行聚合操作,并更新新节点信息,每次执行最多减少K个模块;步骤8):重新计算新的模块与所有旧模块之间的距离,更新边信息,步骤9):重复第5‑8步,直到最后达到6‑7(常见组件图的规模)为止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810221525.6/,转载请声明来源钻瓜专利网。