[发明专利]一种线性分类模型缺陷发生预测方法在审
申请号: | 201910626126.2 | 申请日: | 2019-07-11 |
公开(公告)号: | CN110348633A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 郑泽忠;谢乐;牟范;侯安锴;江邵斌;马鹏程 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62 |
代理公司: | 成都时誉知识产权代理事务所(普通合伙) 51250 | 代理人: | 沈成金 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 缺陷发生 线性分类模型 预测模型 训练样本数据 预测 线性判别分析 缺陷数据 输出预测 输入测试 样本集 分类 构建 加载 算法 监督 | ||
1.一种线性分类模型缺陷发生预测方法,其特征在于,包括如下步骤:
步骤一:缺陷数据集加载;
步骤二:训练样本数据选取;
步骤三:构建线性分类缺陷发生预测模型;
步骤四:基于线性判别分析算法,将训练样本数据输入线性分类缺陷发生预测模型监督训练;
步骤五:输入测试样本集到缺陷发生预测模型,输出预测结果。
2.根据权利要求1所述的一种线性分类模型缺陷发生预测方法,其特征在于,所述的缺陷数据集加载包括缺陷数据缺失值处理和缺陷数据重复值处理;所述的缺陷数据缺失值处理包括如下过程:缺失值的重要性和缺失程度划分为四种:特征重要性高,缺失率低;特征重要性高,缺失率高;特征重要性低,缺失率低;特征重要性低,缺失率高;特征重要性低,缺失率高的做删除处理;缺失率低且重要度高的使用特殊值进行补全,所述的特殊值为无或者NULL;特征重要性高,采用关联补全法在无任何缺失数据的正常数据集中匹配出一个和缺失值样本重合度高的样本,用正常数据集中的值补充缺失样本中的对应缺失值。
3.根据权利要求要求2所述的一种线性分类模型缺陷发生预测方法,其特征在于,所述的缺陷数据重复值处理包括如下过程:所述的重复值包括列重复和行重复;所述的列重复为特征重复,行重复为数据相同,1)列重复,选择其中一个特征保留,其余特征删除;2)数据行重复,首先考虑唯一性,对于同一特征的每个值都不同于该特征的其它值,若有重复,则删除;对于缺失值造成的重复,则保留;对于录入重复的数据,则删除;得到原始数据集。
4.根据权利要求1所述的一种线性分类模型缺陷发生预测方法,其特征在于,所述的预测目标构建包括缺陷发生预测目标构建和缺陷等级预测目标构建;所述的缺陷等级预测目标构建包括如下过程:在缺陷等级预测模型计算WOE值时,将四分类转化为二分类,对输出变量缺陷等级构造四个计算目标,分别为level_1,level_2,level_3,level_4,所述的缺陷等级包括一般、紧急、重大和其它四个等级;具体如下:level_1,缺陷等级紧急所对应的值记为1,另外三种等级所对应的值为0;level_2:缺陷等级重大所对应的值记为1,另外三种等级所对应的值为0;level_3:缺陷等级一般所对应的值记为1,另外三种等级所对应的值为0;level_4:缺陷等级其它所对应的值记为1,另外三种等级所对应的值为0。
5.根据权利要求1所述的一种线性分类模型缺陷发生预测方法,其特征在于,所述的缺陷数据集包括台账数据、铭牌数据、地理数据、变电站数据、电压数据;将所有数据整合为二维矩阵形式,每一行数据代表一个数据样本,每列代表一个变量。
6.根据权利要求3所述的一种线性分类模型缺陷发生预测方法,其特征在于,所述的缺陷数据集加载还包括数据切分,所述的数据集切分将原始数据集平均切分为3份,采用WOE编码规则对数据做3折交叉赋值编码,最后得到WOE特征编码数据集。
7.根据权利要求1所述的一种线性分类模型缺陷发生预测方法,其特征在于,所述的训练样本数据在WOE特征编码数据集中随机选取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910626126.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理