[发明专利]一种用于关键质量特征选择的方法在审
申请号: | 202210732920.7 | 申请日: | 2022-06-27 |
公开(公告)号: | CN114897107A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 赵永威;赵永满;马尚鹏;周雪;魏子凯 | 申请(专利权)人: | 石河子大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 832003 新疆维吾尔自治*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 关键 质量 特征 选择 方法 | ||
本发明涉及一种用于关键质量特征选择的方法,属于智能制造和机器学习领域。本发明首先根据车间的传感器获取产品质量数据集;利用最大信息系数算法对质量数据集的特征进行初筛;利用留出法将产品质量数据集划分为训练集和测试集;将特征的数量和准确率作为优化目标,通过人工鱼群算法进行寻优,同时优化特征的数量和准确率这两个目标,得到降维后的关键质量特征子集;使用分类器SVM在测试集上进行评估,确定指标验证该方法的有效性。
技术领域
本发明属于智能制造和机器学习领域,具体是一种用于关键质量特征选择的方法。
背景技术
在产品的制造加工过程中,将产品质量引入到加工工序中,通过这样的方法可以防止缺陷的产生,提高产品的质量。通过对加工过程中关键质量特征选择,可以对关键质量特征进行控制,能够降低生产成本和废品率、提高产品的经济效益。
特征选择在智能制造和机器学习领域中起着至关重要的作用。特征空间通常包含可能相关、不相关或冗余的特征。但是不相关和冗余特征的存在会降低最终分类器的准确率。通过特征选择来识别最佳特征子集,以降低特征空间的维数,减少运行时间,并提高分类性能。启发式算法是一种基于直观或经验构造的算法,在可接受的计算时间和空间给出待解决组合优化问题每一个实例的一个可行解,启发式算法适合全局搜索,并且能够逃离局部最优子集。
发明内容
针对现有技术的不足,本发明提供一种用于关键质量特征选择的方法。
本发明的技术方案如下:
一种用于关键质量特征选择的方法,包括:
获取产品质量数据集;
最大信息系数算法对产品质量数据集的特征进行初筛;
将产品质量数据集划分为训练集和测试集;
确定目标函数,通过人工鱼群算法进行寻优,得到关键质量特征子集;
使用分类器SVM在测试集上进行评估,确定指标验证该方法的有效性。
所述获取产品质量数据集,包括:
通过生产车间的传感器获取产品的加工参数,得到一组A×B产品质量数据集;
其中A表示样本的数量,B表示特征的数量。
所述最大信息系数算法对产品质量数据集的特征进行初筛,包括:
特征f和类别c的MIC定义如下:
(1)
式中,E={(fi,cj),i=1,2,...,N,j=1,2,...,C}是一个有序对集合,X表示将fi的值域划为X段,Y表示将cj的值域划为Y段,XYB(n)表示网格数目不能大于B(n)(数据总量的0.6或0.55次方),分子I(E,X,Y)表示不同X×Y网格划分下的互信息最大值,分母ln(min(X,Y))表示将不同划分下的最大互信息值归一化;
得到每个样本的各个特征与类别的最大信息系数后,将其依照降序排序,设置阈值d,去掉不相关和冗余特征,得到关键质量特征子集。
所述将产品质量数据集划分为训练集和测试集,包括:
采用留出法,按照70%测试集,30%测试集的方式对数据进行划分。
所述确定目标函数,通过人工鱼群算法进行寻优,得到关键质量特征子集包括:
将特征的数量和分类器SVM的准确率作为优化目标,具体公式如下:
(2)
其中X是一个b维的向量,其中每一维可以取1或0的值,b是输入特征的数量,当取1时表示在子集中选择了特征,当取0时在子集中没有选择了特征。该公式表示的是最小化特征的数量;
(3)
该公式表示最大化SVM分类器计算的分类精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石河子大学,未经石河子大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210732920.7/2.html,转载请声明来源钻瓜专利网。