[发明专利]基于k-邻近SMOTE和深度学习的变压器故障诊断方法有效
申请号: | 201910717685.4 | 申请日: | 2019-08-05 |
公开(公告)号: | CN110398650B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 高树国;夏彦卫;刘云鹏;和家慧;许自强;李刚;贾志辉;张志刚;赵军 | 申请(专利权)人: | 国网河北省电力有限公司电力科学研究院;华北电力大学(保定);国家电网有限公司 |
主分类号: | G01R31/00 | 分类号: | G01R31/00;G06N3/08 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 李兴林 |
地址: | 050000 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 邻近 smote 深度 学习 变压器 故障诊断 方法 | ||
本发明公开了一种基于k‑邻近SMOTE和深度学习的变压器故障诊断方法,包括对初始不平衡样本集做预处理、DNN神经网络训练、诊断测试步骤。本发明在进行插值前,先对少数类样本进行聚类,以聚类划分的区域进行插值,避免了在插入数据的过程中由于存在泛化性而导致数据分布边缘化以及模糊正负类边界的问题;生成的插值在簇心和原始少数类样本点的连线上,这样就不会存在数据分布边缘化的情况,改善了诊断效果。
技术领域
本发明涉及一种变压器故障诊断方法,尤其涉及一种基于k-邻近SMOTE和深度学习的变压器故障诊断方法,属于供电技术领域。
背景技术
变压器故障是变压器本身及其应用环境综合作用和长期积累的结果,故障的特征量多种多样,故障特征量与故障机理间的联系也错综复杂,给建立变压器故障诊断模型造成了很大的困难。
在变压器故障诊断中,由于变压器故障是小概率事件,非正常状态变压器真实分布非常少,同时存在变压器故障案例报告记录信息不全面和案例库中记录信息不全的问题,故障表征数据是非均衡分布的,简称为非均衡数据集。由于非均衡数据集的类别数量分布极端不均衡,会极大地影响分类任务的分析预测,模型会偏向于多数类进行判断,使得故障诊断结果错误。
非均衡数据集的类别数量分布极端不均衡,在机器学习模型进行分类任务的分析预测,会出现过拟合、欠拟合等问题,极大降低了机器学习模型的准确性和鲁棒性。
合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)是基于随机过采样的改进,通过线性插值的方法来生成新的少数类样本,添加到原始数据集中,在一定程度上避免了欠采样中出现的过拟合问题。
但SMOTE自身也存在着以下问题。第一,SMOTE在确定近邻值k时存在一定的盲目性,k是超参数,即人为规定的一个参数,k是一个经验值,所以在进行近邻选择时存在着一定的主观性,可能会导致采样效果很差。第二,在进行SMOTE过采样之后,容易产生数据分布边缘化,改变了非均衡数据集的数据分布,从而产生模糊正负类边界的问题。若原样本点在少数类样本的边界,则可能会引起新插值对象向多数类样本靠近,进而改变了原始非均衡数据集的分布,从而模糊了正负类样本的边界。
随着计算机技术和人工智能理论的快速发展,逐渐出现了专家系统、机器学习、深度学习等智能技术,为电力变压器智能故障诊断开辟了新的途径。
发明内容
本发明要解决的技术问题是提供一种基于k-邻近SMOTE和深度学习的变压器故障诊断方法。
为解决上述技术问题,本发明采用的技术方案是:
一种基于k-邻近SMOTE和深度学习的变压器故障诊断方法,包括以下步骤:
步骤1:对初始不平衡样本集做预处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网河北省电力有限公司电力科学研究院;华北电力大学(保定);国家电网有限公司,未经国网河北省电力有限公司电力科学研究院;华北电力大学(保定);国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910717685.4/2.html,转载请声明来源钻瓜专利网。