[发明专利]一种线性分类模型缺陷发生预测方法在审
申请号: | 201910626126.2 | 申请日: | 2019-07-11 |
公开(公告)号: | CN110348633A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 郑泽忠;谢乐;牟范;侯安锴;江邵斌;马鹏程 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62 |
代理公司: | 成都时誉知识产权代理事务所(普通合伙) 51250 | 代理人: | 沈成金 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 缺陷发生 线性分类模型 预测模型 训练样本数据 预测 线性判别分析 缺陷数据 输出预测 输入测试 样本集 分类 构建 加载 算法 监督 | ||
本发明公开了一种线性分类模型缺陷发生预测方法,包括如下步骤:步骤一:缺陷数据集加载;步骤二:训练样本数据选取;步骤三:构建线性分类缺陷发生预测模型;步骤四:基于线性判别分析算法,将训练样本数据输入线性分类缺陷发生预测模型监督训练;步骤五:输入测试样本集到缺陷发生预测模型,输出预测结果。通过本发明,可以实现一种线性分类模型缺陷发生预测方法。
技术领域
本发明涉及机器学习领域,具体是一种线性分类模型缺陷发生预测方法。
背景技术
在电力系统中,电容型设备属输变电设备,其数量多,约占变电站设备总量的40%~50%,包括电流互感器、套管、耦合电容器、电容式电压互感器等,在电力系统设备中占有极其重要的地位。电容型设备的健康运行和电气设备安全对于变电站至关重要,如果发生缺陷将会对整个变电站造成很大的影响,一些事故甚至还会危及到人员的人身安全和周边其他设备安全,造成很大的损失。所以,一种好的,能够准确识别电容型设备缺陷等级的预测方法就是当前所迫切需要的,也具有很高的应用价值。
从电容型设备缺陷预测方面来看,国内外主流研究方向是设备运行出现缺陷后,汇聚这类缺陷的数据并进行分析整合,为后期设备维护提供依据。但是没有关于缺陷等级预测方面的相关成果较少。
而今一些比较成熟的机器学习算法已经广泛地应用于各个领域的数据分析中,而且也可能是未来很长一段时间里的热门研究方向。由于当前电网数据的爆发式增长,及各种传感器的层出不穷,造成电容型设备数据量庞大,数据特征复杂,数据质量参差不齐,直接应用传统的统计学方法很难获得理想的结果。所以使用何种合适的机器学习算法对大规模数据进行分析,怎样改进已有机器学习算法提高模型效果都是需要进一步研究的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种线性分类模型缺陷发生预测方法,其特征在于,包括如下步骤:
步骤一:缺陷数据集加载;
步骤二:训练样本数据选取;
步骤三:构建线性分类缺陷发生预测模型;
步骤四:基于线性判别分析算法,将训练样本数据输入线性分类缺陷发生预测模型监督训练;
步骤五:输入测试样本集到缺陷发生预测模型,输出预测结果。
进一步的,所述的缺陷数据集加载包括缺陷数据缺失值处理和缺陷数据重复值处理;所述的缺陷数据缺失值处理包括如下过程:缺失值的重要性和缺失程度划分为四种:特征重要性高,缺失率低;特征重要性高,缺失率高;特征重要性低,缺失率低;特征重要性低,缺失率高;特征重要性低,缺失率高的做删除处理;缺失率低且重要度高的使用特殊值进行补全,所述的特殊值为无或者NULL;特征重要性高,采用关联补全法在无任何缺失数据的正常数据集中匹配出一个和缺失值样本重合度高的样本,用正常数据集中的值补充缺失样本中的对应缺失值。
进一步的,所述的缺陷数据重复值处理包括如下过程:所述的重复值包括列重复和行重复;所述的列重复为特征重复,行重复为数据相同;具体的,1)列重复,选择其中一个特征保留,其余特征删除;2)数据行重复,首先考虑唯一性,对于同一特征的每个值都不同于该特征的其它值,若有重复,则删除;对于缺失值造成的重复,则保留;对于录入重复的数据,则删除;得到原始数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910626126.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理