[发明专利]变色龙算法中相似性度量及截断方法有效
申请号: | 201810589956.8 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108932528B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 董宇欣;姜凯;谢晓东;褚慈;秦帅;印桂生;王野;王红滨;王勇军;白云鹏 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 变色龙 算法 相似性 度量 截断 方法 | ||
1.变色龙算法中相似性度量及截断方法,其特征在于,包括如下步骤:
针对于Pendigits数据集所包含类型的图像特征数据,确定图像特征数据的稀疏图;
变色龙在稀疏图上运行,其中节点表示数据项,加权边表示数据项之间的相似性,变色龙通过使用两阶段算法找出数据集中的簇,在第一阶段,根据数据集构造出一个k-最近邻图Gk,使用图分区算法将数据项分为几个相对较小的子集群,在第二阶段,它使用一种算法,通过重复组合这些子集群来找到真正的集群;
在分区阶段,采用基于递归二分法的分区方法;在合并阶段,引入了改进的相似性度量,加入γ这个附加值作为合并过程中簇密度的评估和比较,其中γ表示簇密度的商--稀疏簇的密度除以密集簇的密度,当计算其中某一个簇中只包含一个节点的簇对之间的相似性时,仅计算该对的外部属性,得到的聚类相似度被设置为外部相似度乘以常数;提供了一个简单而有效的截断方法,称为第一跳截止;
所述的改进的相似性度量具体为:
在合并期间,引入了γ这个附加值作为合并过程中簇密度的评估和比较,其中γ表示簇密度的商--稀疏簇的密度除以密集簇的密度,还包括内部和外部集群的属性,
整个改进公式可以写成:
Sim(Ci,Cj)=RI(Ci,Cj)α×RC(Ci,Cj)β×γ(Ci,Cj) (1)
其中,|Ci,j|表示连接簇Ci和簇Cj之间的边的数量;RI(Ci,Cj)表示相对互连度;EC{Ci,Cj}表示绝对互连性;RC(Ci,Cj)表示相对接近度;β是用户指定参数;
当计算其中某一个簇中只包含一个节点的簇对之间的相似性时,仅计算该对的外部属性,得到的聚类相似度被设置为外部相似度乘以常数;
所述的第一跳截止具体为:
截断中第一次大幅跳跃是两个应该分开的聚类开始合并的地方是切割的地方,计算树状图上半部分级别之间的平均距离找到第一个跳跃,在此之后,寻找比计算的平均值大100倍的第一个距离的下半部分级别,如果找到了,则在这些级别之间进行切割,如果没有找到,我们搜索至少比计算的平均值大50倍的第一跳,如果还没有找到,则搜索比平均值大25倍的第一跳,依次2倍递减。
2.根据权利要求1所述的变色龙算法中相似性度量及截断方法,其特征在于,所述的基于递归二分法的分区方法,叫做flood fill漫水填充法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810589956.8/1.html,转载请声明来源钻瓜专利网。