[发明专利]基于主成分分析和随机森林相融合的变压器故障诊断方法在审
申请号: | 202111298905.8 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114019282A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 陈龙谭;于虹;李昊;王宣军 | 申请(专利权)人: | 云南电网有限责任公司电力科学研究院 |
主分类号: | G01R31/00 | 分类号: | G01R31/00;G01N30/02 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 650217 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成分 分析 随机 森林 融合 变压器 故障诊断 方法 | ||
1.一种基于主成分分析和随机森林相融合的变压器故障诊断方法,其特征在于,包括:
对已明确故障类型的变压器进行油色谱的检测,提取检测到的故障变压器的故障油色谱数据,将所述故障油色谱数据整合为故障油色谱数据集;
将所述故障油色谱数据集进行比值升维,将比值升维后的所述故障油色谱数据集作为第一故障油色谱数据集,并进行故障编码;
根据所述第一故障油色谱数据集中36个维度特征之间的相关性热力图,判断各维度特征间的相关性;
建立主成分分析模型,采用所述主成分分析模型消除各维度特征间的相关性,将所述第一故障油色谱数据集调参优选至剩余8个主要特征,并将调参优选至剩余8个主要特征的所述第一故障油色谱数据集作为第二故障油色谱数据集,所述第二故障油色谱数据集中包含所述第一故障油色谱数据集中99%的信息量,将所述第二故障油色谱数据集按照0.8:0.2的比例划分为训练集和测试集;
建立调参优选的随机森林分类模型,采用所述训练集训练所述随机森林分类模型,将训练好的所述随机森林分类模型作为第一随机森林分类模型,再采用所述测试集检测所述第一随机森林分类模型的故障诊断准确率,当所述第一随机森林分类模型的故障诊断准确率大于等于设定的故障诊断准确率时,将所述第一随机森林分类模型作为最终随机森林分类模型;
将新检测到的变压器油色谱数据输入到所述最终随机森林分类模型中进行故障诊断,得出变压器是否存在故障的诊断结果。
2.根据权利要求1所述的基于主成分分析和随机森林相融合的变压器故障诊断方法,其特征在于,所述建立主成分分析模型,采用所述主成分分析模型消除各维度特征间的相关性,将所述第一故障油色谱数据集调参优选至剩余8个主要特征,并将调参优选至剩余8个主要特征的所述第一故障油色谱数据集作为第二故障油色谱数据集,所述第二故障油色谱数据集中包含所述第一故障油色谱数据集中99%的信息量,包括:
输入n维空间的样本集合X=x1,x2,…,xm,其中xi∈xm,并映射到k维空间;
预处理,将样本均值变为0的公式为:
预处理,将样本方差变为1的公式如下:
xi=xi/σ
计算协方差矩阵XXT,对协方差矩阵XXT进行特征分解;
求取最大的k个特征值,以及特征值对应的k个特征向量,记为ω1,ω2,···,ωk
输出投影矩阵W={ω1,ω2…,ωk},其中ωk∈Rn,调参优选过程中,维度数与主成分数量相同,主成分数量k选择最小的k,使满足保留原始数据99%的差异性的公式如下:
其中,m表示特征个数;X(i)表示初始矩阵;表示降维至k维后的矩阵,分子表示原始点与投影点之间的距离之和,而误差越小,说明降维后的数据越能完整表示降维前的数据,如果这个误差小于0.01,说明降维后的数据能保留99%的信息。
3.根据权利要求1所述的基于主成分分析和随机森林相融合的变压器故障诊断方法,其特征在于,所述建立调参优选的随机森林分类模型,包括:
将不纯度的衡量指标设定为:criterion='mse'、是否有放回的采样设定为:bootstrap=True、限制分枝时考虑的特征个数设定为:max_features='sqrt'、树的最大深度设定为:max_depth=80、根据属性划分节点时,将每个划分最少的样本数设定为:min_samples_split=5、决策树的个数设定为:n_estimators=1000、叶子节点最少的样本数设定为:min_samples_leaf=4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司电力科学研究院,未经云南电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111298905.8/1.html,转载请声明来源钻瓜专利网。