[发明专利]电容型设备缺陷等级预测方法及装置在审
申请号: | 201910690094.2 | 申请日: | 2019-07-29 |
公开(公告)号: | CN110399685A | 公开(公告)日: | 2019-11-01 |
发明(设计)人: | 彭晶;马仪;李江;江邵斌;王科;谭向宇;郑泽忠;邓云坤;李昊;陈宇民;段雨廷 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06K9/62 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650217 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测模型 电容型设备 预处理 算法 编码后数据 等级预测 随机森林 新数据包 预测结果 数据包 拓展 实际数据 实时性好 训练模型 预测 申请 | ||
1.电容型设备缺陷等级预测方法,其特征在于,所述方法包括:
S01:获取所有电容型设备的数据包,对所述数据包内的所有数据进行预处理,获得新数据包;
S02:采用评分卡模型的WOE编码对所述新数据包的所有数据进行编码,获得编码后数据;
S03:采用SMOTE算法对所述编码后数据进行拓展处理,获得拓展后数据;
S04:采用随机森林算法建立预测模型,并利用所述拓展后数据和所述设备是否发生过故障,训练所述预测模型,得到最优预测模型;
S05:将电容型设备的实际数据输入到所述最优预测模型中进行预测,得到预测结果。
2.根据权利要求1所述的方法,其特征在于,所述获取所有电容型设备的数据,对所述数据进行预处理,获得新数据包,包括:
S011:获取的大型电容型设备的数据包括至少9种数据;
S012:对缺失一类或几类数据的电容型设备的数据包进行人工填补,获得完整数据包;
S013:将所述数据包和所述完整数据包中的同一类数据进行格式统一,获得统一数据包,其中,所述统一数据包的同一类数据具有统一格式;
S014:计算所述统一数据包中同一类数据的聚类中心,计算同一类数据中各个数据与聚类中心的距离长度;
S015:当距离长度小于等于设定阈值时,所述数据为正确数据,无需人工修改;当距离长度大于设定阈值时,所述数据为错误数据,并将错误数据进行人工修改,获得新数据包。
3.根据权利要求1所述的方法,其特征在于,所述采用评分卡模型的WOE编码对所述新数据包的所有数据进行编码,获得编码后数据,包括:
S021:将所有大型电容型设备分为三组,分别为第一组、第二组和第三组;
S022:将第一组数据和第二组数据组合为新一组,并将所述新一组中所有电容型设备的同一类数据中的相同数据归为一个基团,采用公式(1)计算所述基团针对所有缺陷等级的编码,形成第一编码字典;
其中,Wil表示第i个基团针对缺陷等级为l的编码,Bil表示数据的第i个基团中各数据对应的设备曾经发生过缺陷等级为l的数量,Gil表示数据的第i个基团中各数据对应的设备未发生过缺陷等级为l的数量,BTl表示数据中各数据对应的设备发生过缺陷等级为l的数量,GTl表示数据中各数据对应的设备未发生过缺陷等级为l的数量,s为非零常数;
S023:根据所述第一编码字典找到第三组中的电容型设备各类数据对应的基团,采用对应的基团编码替换电容型设备中对应数据,获得第三编码数据;
S024:将第一组和第三组数据组合为新二组,所述新二组采用公式(1)形成第二编码字典,并根据所述第二编码字典找到第二组中的电容型设备各类数据对应的基团,采用对应的基团编码替换电容型设备中对应数据,获得第二编码数据;
S025:将第二组和第三组数据组合为新三组,所述新三组采用公式(1)形成第三编码字典,并根据所述第三编码字典找到第三组中的电容型设备各类数据对应的基团,采用对应的基团编码替换电容型设备中对应数据,获得第一编码数据;
S026:将所述第一编码数据、所述第二编码数据和所述第三编码数据重新组合为一组数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910690094.2/1.html,转载请声明来源钻瓜专利网。