[发明专利]基于数据挖掘技术的带电检测数据处理方法在审
申请号: | 201410091331.0 | 申请日: | 2014-03-12 |
公开(公告)号: | CN103902816A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 朱付保;孙彤;刘书如;王华;李祖贺;霍晓齐;白庆春 | 申请(专利权)人: | 郑州轻工业学院 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张绍琳;张真真 |
地址: | 450002*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于数据挖掘技术的带电检测数据处理方法。本发明属于信息技术中的数据挖掘技术领域,特别是涉及电力设备中的变压器、断路器、避雷器等的状态分析技术与方法。针对传统电力设备状态检修中存在的检修滞后以及计划检修过多的冗余的工作,建立了粗糙集和决策树相结合的数据挖掘状态分析模型,并结合已有的电力设备状态检修系统构建了基于数据挖掘技术的带电检测数据处理系统。将粗糙集和决策树的融合技术运用到电力设备状态数据分析中,根据已有的状态判决标准,对35KV及以上变压器、SF6断路器等电力设备状态数据进行数据预处理、对属性进行Gini系数索引、属性约简、阈值选择等步骤,并在此基础上进行状态分析,同时形成工作状态表并给出相应的处理方案。 | ||
搜索关键词: | 基于 数据 挖掘 技术 带电 检测 数据处理 方法 | ||
【主权项】:
基于数据挖掘技术的带电检测数据处理方法,特征在于:它的步骤如下:(1)数据清洗、属性约简,从电力公司提供的真实数据中,提取500组针对某一变压器状态分析的数据,其中选出200组作为测试数据集,剩余的300组作为验证数据集,根据设备状态评判标准将200组训练样本数据中明显错误的组项予以删除,运用粗糙集中基于依赖度的改进的属性约简方法先求出样本数据集的核,进而根据核值计算出约简集,得出约简后的决策表;(2)决策树的构建,运用C4.5算法,根据查阅的计算公式先求出给定样本分类所需的期望信息,也即信息熵值,下一步计算出每个属性的信息增益,具有最高信息增益的属性选作以上获得的决策表的测试属性,创建一个结点,并以该属性标记,如果上面得到的训练样本集都属于同一类或者候选属性为空则将该结点作为叶子结点,否则根据该属性每个值创建分枝,并据此划分样本,构建得到决策树;(3)决策树剪枝、生成规则,采用代价复杂性剪枝算法对生长完全的树剪去分枝,通过删除结点的分枝,剪掉树结点,对于树中每一个非树叶结点,计算该结点上的子树被剪枝可能出现的期望错误率,然后,使用每个分枝的错误率,结合沿每个分枝观察的权重评估,计算不对该结点剪枝的期望错误率,如果剪去该结点导致较高的期望错误率,则保留该子树,否则剪去该子树,产生一组逐渐被剪枝的树之后,使用一个独立的测试集评估每棵树的准确率,得到具有最小期望错误率的决策树,根据剪枝后的决策树生成相应规则,运用验证数据集合对生成的规则进行验证,如生成规则不符合,或未达到预期标准,则重新进行计算,直至生成规则符合要求;(4)构建系统,根据电力公司的需求,将系统划分分建立试验数据的管理中心、实验数据的预处理、依据试验数据进行诊断分析、设备状态的趋势分析、决策分析、提供查询统计等辅助功能和生成试验报告等功能模块,其中设备状态的趋势分析模块即为粗糙集和决策树算法的代码实现,使用JavaEE中的Struts2+Spring+ Ajax等技术建立系统框架,Struts2框架实现MVC开发模式的设计,运用Spring的分层架构来灵活的选择所需组件,Ajax技术则高效地实现了用户与前台页面的动态交互。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院,未经郑州轻工业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410091331.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置