[发明专利]基于区间阴影集和密度峰值聚类的钢材质量检测方法有效
申请号: | 201910077726.8 | 申请日: | 2019-01-28 |
公开(公告)号: | CN109858544B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 张清华;陈玉洪;刘学颖;杨洁 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 卢胜斌 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 区间 阴影 密度 峰值 钢材 质量 检测 方法 | ||
本发明属于钢材质量测试领域,具体涉及一种基于区间阴影集和密度峰值聚类的钢材质量检测方法;所述方法包括获取原始钢材数据集,采用欧式距离公式计算得到其距离矩阵;通过密度峰值聚类中的计算公式,获取局部密度矩阵和相对距离矩阵;输出密度峰值聚类中数据集的决策图,并选取m个聚类中心,将非聚类中心进行归类得到m个类簇;计算出m个类簇中各个对象的隶属度值;通过最小化模糊熵差异,确定出m个类簇的最优阈值序列;基于最优阈值序列,采用分类规则分别对m个类簇中的非中心对象按照其隶属度值采用区间阴影集进行三支分类,从而确定出每个对象的质量检测结果,即获得原始钢材数据集的质量检测结果。本发明能够有效且快速的检测出钢材质量。
技术领域
本发明属于钢材质量测试领域,具体涉及一种基于区间阴影集和密度峰值聚类的钢材质量检测方法。
背景技术
冶金工厂生产各种钢材,出厂时都要按照相应标准及技术文件的规定进行各项检测。检测过程将会产生大量数据,且随着生产的进行,数据呈现爆炸式增长,人工比对各项数据在此大数据背景下不仅耗费人力成本,同时效率低下,甚至无法完成质量检测工作。其次,钢材大数据信息系统的属性不仅多样化,而且属性之间往往具有一定的关联性。因此,诸如粒计算理论、聚类分析等数据挖掘方法大量应用于工业大数据中,快速有效提升知识发现的效果。
钢材质量检测中,检测结果通常可分为m种不同等级,该m类分别对应聚类分析算法中的m个类簇。但此分类形成的是一个初步检测结果。
2014年,Alex Rodriguez在《Science》上发表的密度峰值聚类(Density PeaksClustering,DPC)引起了业界广泛关注。大量密度峰值聚类相关算法得到广泛研究。算法能够快速、有效地发现任意形状的簇。该算法同时具有K中心点聚类(K-medoids)算法、基于密度的空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法和均值漂移聚类(Mean-Shift)算法的特点,简洁新颖。该算法的中心点同时具有以下两个特点:本身的密度大,即它被密度均不超过它的邻居包围;与其他密度更大的数据点之间的“距离”相对更大。
类簇中心点找到后,剩余的每个点被决策归类到它的有更高密度的最近邻所属类簇,此过程只需一步完成。因此该算法的优势在于无需迭代,极大地降低了算法的成本开销。本发明中定义了类簇的边界区域,通过对边界内对象的处理来进一步检测噪声对象,但此方法受截断距离dc的设置影响较大,dc的设置不合理可能引起对噪声对象的处理能力降低,导致类簇结构划分不合理,影响聚类效果。
DPC算法的核心思想在于对中心点的刻画上,显然,中心点是局部密度和与高密度点之间的相对距离均大的点。因此,该算法主要有两个需要计算的量:每个点的局部密度ρ以及与高密度点之间的相对距离δ;在数据集中,通过初始化参数dc;计算每个对象的局部密度ρ和相对距离δ;输出决策图,并选取聚类中心;将非聚类中心进行归类得到Ck(k=1,2,…,m);对边界区域的对象进行噪声检测,并进一步分配给core区域或halos区域,即划分为优质钢材或劣质钢材。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910077726.8/2.html,转载请声明来源钻瓜专利网。