[发明专利]一种两级式变压器油纸绝缘时域介电响应特征量优选方法有效
申请号: | 201910761081.X | 申请日: | 2019-08-17 |
公开(公告)号: | CN110426612B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 刘庆珍;蔡超;蔡金锭 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 钱莉;蔡学俊 |
地址: | 350108 福建省福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 两级 变压器 油纸 绝缘 时域 响应 特征 优选 方法 | ||
1.一种两级式变压器油纸绝缘时域介电响应特征量优选方法,其特征在于,包括以下步骤:
步骤S1:收集变压器时域介电响应法的现场实测数据作为样本,将收集到样本根据变压器油纸绝缘状态划分为绝缘状态良好、绝缘状态一般、绝缘状态恶劣3个大类;提取时域介电特征量,构成初始特征空间Ω1;
步骤S2:基于特征间冗余度最小的方法,进行特征选择,形成冗余性最低特征空间Ω2;
步骤S3:综合距离、信息、相关性三种统计学指标对每个特征进行评价,设Si为特征Xi的综合得分,以特征Xi在类可分性特征选择过程的综合得分Si作为依据剔除类别可区分度低于预设阈值的特征量,使特征空间维数降至第一级特征选择预先设定的阈值m1,并将当前的特征空间记为Ω3;
步骤S4:根据当前特征空间训练RF模型,并利用袋外数据分析特征重要性,每次实验剔除重要性最低的特征后生成新的特征空间,进行多次循环实验后,提取出预设目标维度的多个待选特征空间,基于OOB样本预测错误率及特征空间中每一特征的重要性显著水平,对多个待选特征空间进行综合考虑,择优选出最优特征空间;
其中,步骤S3具体包括以下步骤:
步骤S31:基于类内类间距离指标采用改进F-Score,在变压器样本类别集合Y已知情况下,特征量Xi的改进F-Score根据式(3)计算:
式中,my表示类别为y的样本个数,分别表示特征Xi属于类别y的某一元素和样本均值,n表示样本类别集合Y中的类别个数;
步骤S32:采用互信息作为度量手段进行信息测度,特征向量Xi与样本类别集合Y的互信息采用式(4)计算:
式中,px、py分别为Xi与Y的边缘分布概率,pxy为联合分布概率,计算互信息时采用核密度估计的方法对特征进行离散化;
步骤S33:利用式(5)于计算特征与类别的皮尔森相关系数ρXY,用于度量该特征对于类别的相关度:
步骤S34:如式(6)进行无量纲处理后累加步骤S31~S33的3个指标得分,得到综合得分Si:
按Si得分进行降序排列,剔除得分垫底的特征,使特征空间维数降至第一级特征选择预先设定的阈值m1,并将当前的特征空间记为Ω3;
其中,步骤S4具体包括以下步骤:
步骤S41:在第一级选择后维度为m1的特征空间Ω3条件下,训练具有t棵树组成的RF模型,同时统计每棵树T的OOB数据,将第j棵树的OOB数据记为Rj=[r1…ri…rm1],其中ri表示时域特征Xi在第j棵树对应的样本列向量,j∈[1,t];
步骤S42:利用RF中每棵树,对其相应的OOB数据Rj诊断,并计算分类正确率,记为Aj1;
步骤S43:随机置换OOB样本Rj中特征Xi对应列ri的每一个值,保持其他特征量值不变,生成新的样本矩阵并记为Rj(i)=[r1…ri(i)…rm1];定义ek为仅有一个随机位置为1元素的单位行向量,则置换过程如式(7)表示:
ri(i)=[e1...ek...em1]ri (7);
步骤S44:利用每棵决策树对Rj(i)中相应的OOB数据做出预测并计算OOB正确率,记为Aj2;
步骤S45:定义Vi为特征Xi在当前特征空间下的重要度,其值等于因为样本置换导致随机森林分类正确率下降的平均值:
步骤S46:计算当前特征空间下的每个特征的重要度Vi,每次循环实验时淘汰重要度最低的特征后,形成新的特征空间;
步骤S47:重复步骤S41至步骤S46,直至特征空间维度达到预设目标阈值m2,提取出多个待选特征空间;
步骤S48:基于OOB样本预测错误率及特征空间中每一特征的重要性显著水平对多个待选特征空间进行综合考虑,择优选出最优特征空间ΩZ。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910761081.X/1.html,转载请声明来源钻瓜专利网。