[发明专利]基于文本挖掘的精细化拟合识别变压器故障方法及设备在审
申请号: | 202210538012.4 | 申请日: | 2022-05-18 |
公开(公告)号: | CN114912460A | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 胡俊华;李晨;王雅雯;蔺家骏;王渊;马国明;郑一鸣;高山;刘咏飞;杨景刚;赵科 | 申请(专利权)人: | 国网浙江省电力有限公司电力科学研究院;华北电力大学;国网江苏省电力有限公司电力科学研究院;国网浙江省电力有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06K9/62;G06N3/04;G06N3/08;G06Q10/00 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 许守金;张建青 |
地址: | 310014 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文本 挖掘 精细 拟合 识别 变压器 故障 方法 设备 | ||
本发明公开了基于文本挖掘的精细化拟合识别变压器故障方法及设备,属于变压器故障识别技术领域。本发明的基于文本挖掘的精细化拟合识别变压器故障方法,在数据预处理时,对变压器故障文本数据进行切分,同时进行数据增强处理,一方面能够有效避免语义信息丢失,另一方面在有限的样本量里向主体模型提供尽可能多的特征,使得变压器故障类型中样本数量少的故障描述文本在模型计算拟合损失值时占比更大,避免过拟合,增强了模型识别效果;通过全连接层进行线性降维处理得到全局语义向量;利用Canopy+K‑Means模型对所有计算结果进行聚类处理,识别出变压器故障文本数据的具体故障部位和故障类型,提升整体语义的理解能力,方案科学合理,切实可行。
技术领域
本发明涉及基于文本挖掘的精细化拟合识别变压器故障方法及设备,属于变压器故障识别技术领域。
背景技术
电力变压器是电力系统正常运行中不可或缺的设备之一,在变压器发生故障后,巡检人员根据现场情况以文本形式进行记录并判断形成故障分析报告。由于巡检人员的实践经验、知识储备和专业能力良莠不齐,不仅对相同故障现象的记录有不同的描述形式,而且很多时候难以准确判断故障缘由,从而出现误判的情况,因此依靠人工判断的方法效率不高。随着人工智能领域自然语言处理技术的发展,可以实现基于电力文本信息挖掘的故障自动判别。
现有的针对电力文本信息挖掘的设备主要是基于TextCNN、BiLSTM、BERT以及传统机器学习等方法,现有设备中采用的分类方法主要有逻辑回归分类器、贝叶斯分类器、支持向量机等,这些设备可以实现样本数量多、故障类型数目单一的短文本机器识别与故障分类,但在对小样本、故障类型数目不确定的变压器故障长文本的识别与分类时易出现过拟合现象,导致故障识别准确率极低。
进一步,现有的设备无法实时反馈巡检人员高准确率的故障信息,不能满足电力现场的实际应用。
发明内容
针对现有技术的缺陷,本发明的目的一在于提供一种在数据预处理时,对变压器故障文本数据进行切分,同时进行数据增强处理,一方面能够有效避免语义信息丢失,另一方面在有限的样本量里向主体模型提供尽可能多的特征;其后对增强文本数据进行向量化处理;然后利用语言表征模型BERT预训练单元设置文本特征提取的初始参数;利用Canopy+K-Means模型对所有计算结果进行聚类处理,识别出变压器故障文本数据的具体故障部位和故障类型,进而能够有效提高语义特征提取质量,提升整体语义的理解能力,方案科学合理,切实可行的基于文本挖掘的精细化拟合识别变压器故障方法。
针对现有技术的缺陷,本发明的目的二在于提供一种能够实时反馈巡检人员高准确率的故障信息,并能够实现变压器故障案例的实时处理、分析,对数量少且包含多故障类型故障描述长文本具有高准确率的识别效果,缓解人员需求,大大降低了人工成本的基于文本挖掘的精细化拟合识别变压器故障设备。
为实现上述目的之一,本发明的第一种技术方案为:
基于文本挖掘的精细化拟合识别变压器故障方法,
包括以下步骤:
第一步:对变压器故障文本数据中超字数的句子文本进行切分,并做增强处理,得到增强文本数据,用以在有限的样本量里向主体模型提供尽可能多的特征;
第二步:对第一步中的增强文件数据,进行初始向量化处理,得到初始向量化的文本矩阵,用以转化为计算机能够理解和计算的向量形式,
第三步:对第二步中的初始向量化的文本矩阵,利用残差连接和层归一化处理进行编码,得到语句向量;
第四步:构建语言表征模型BERT对第三步中的语句向量进行线性降维处理,得到各类故障标签的概率;并通过添加权重动态调整语言表征模型BERT识别损失值;
第五步:对第四步中的各类故障标签的概率,通过Canopy+K-Means模型进行聚类分析;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司电力科学研究院;华北电力大学;国网江苏省电力有限公司电力科学研究院;国网浙江省电力有限公司,未经国网浙江省电力有限公司电力科学研究院;华北电力大学;国网江苏省电力有限公司电力科学研究院;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210538012.4/2.html,转载请声明来源钻瓜专利网。