[发明专利]一种电网生产数据及影响因子相关关系的挖掘方法有效
申请号: | 201410289711.5 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104123605A | 公开(公告)日: | 2014-10-29 |
发明(设计)人: | 豆朋;杜双育;王红斌;高雅;郑晓光;陈剑光;范颖;杨强 | 申请(专利权)人: | 广东电网公司电力科学研究院 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06 |
代理公司: | 广州知友专利商标代理有限公司 44104 | 代理人: | 周克佑 |
地址: | 510080 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电网 生产 数据 影响 因子 相关 关系 挖掘 方法 | ||
技术领域
本发明涉及一种数据挖掘方法,特别是一种电网生产数据及影响因子相关关系的挖掘方法。
背景技术
随着电网信息化建设的推进,电网生产运行过程产生了海量数据,这些数据蕴藏着许多与安全生产和设备管理等领域密切相关的规律和特征,利用技术手段对这些数据进行分析挖掘,从中获得有用的数据,能够辅助企业把握电网生产运行的内在特征,掌握管理规律,提炼业务模式,辅助管理决策,开拓管理创新,从而提升企业的管理精益化水平,推进企业管理方式由粗放型向集约型、精细化转变。
数据挖掘(Data mining)是致力于数据分析和理解、揭示数据内部蕴藏规律的技术,是从大量的含有噪声的数据中挖掘出隐含其中的有着特殊关系性(Association rule learning)的信息的过程,是当前数据分析的先进手段之一。数据挖掘在电网行业的应用还处于探索阶段,目前主要集中于以下几方面:电力系统安全稳定性分析、负荷预测模型的构建、电力系统故障诊断、电力系统仿真模型的性能。
在电网资产生命周期管理中,设备运维是其中时间最长的一个环节。在这一过程中,产生了负荷数据、缺陷记录、试验数据、在线监测数据、事故事件记录等大量生产数据,这些数据不但对安全生产管理本身具有重要意义,还对前期规划、设计、建设等各阶段工作的辅助决策与后评估具有重要参考价值。因此,研究生产数据变动的影响因子,不仅能够把握电网运行的内在特征,而且能够辅助资产全生命周期各个环节决策,有利于进一步提高各业务环节决策精益化水平,推进部门横向协同,促进资产全生命周期闭环管理。
发明内容
本发明所要解决的技术问题,就是提供一种电网生产数据及影响因子相关关系的挖掘方法,考虑了影响电网生产数据变化的不同影响因子的权重,通过不基于候选项集的权重效用树挖掘,获得所有高权值组合,从而挖掘电网生产数据及其影响因子的相关关系,既兼顾了不同影响因子对研究对象的影响程度(即权重),又考虑了算法的时间和空间性能的优化,从而挖掘电网生产运行的内在特征,掌握管理规律,提炼业务模式,辅助管理决策。
解决上述技术问题,本发明采用如下技术方案:
一种电网生产数据及影响因子相关关系的挖掘方法,其特征是包括以下步骤:
S101获取需要进行挖掘的研究对象及与该研究对象相关的多个影响因子的数据;
S102对连续型数据采用等宽分箱法进行离散化处理,默认设置箱的个数为10;
S103整合数据,形成多组包含研究对象及影响因子的组合,将相同时间节点上电网生产数据及影响因子进行整合,形成一个组合,不同时间节点上的组合形成多组包含研究对象及影响因子的组合集;
步骤S104:输入各影响因子及研究对象的权重值(权值的设置主要根据专家经验),为了计算研究对象与其他影响因子的权值,必须给定研究对象的权重,研究对象的权重默认为1;
步骤S105:构建权重效用树(w-Uti Tree),包括以下子步骤:
S105-1设定最小权值阈值min_weight;
S105-2创建初始表:对建立的组合集进行扫描,统计组合集中各项所在的所有组合的权值之和(t_weight),即对于组合集中某一特定的项i,其t_weight的值等于包含项i的所有组合的权值之和。该组合集中每一项对应一个t_weight值。剔除t_weight值小于最小权值阈值的项,并对其余项按t_weight值降序排序,建立初始表,每一行对应组合集中的一个项,将项名称item_name和组合权值t_weight作为每一行属性,记录到初始表中;
S105-3建立w-Uti Tree:扫描初始表,剔除组合中不在初始表中的项,然后将各组合中的项按初始表的顺序排序,所有组合添加到一棵树上,将各组合的最后一项作为该树上的关键节点,在关键节点上记录以下信息:关键节点到树根路径上每个节点的权值node_weight,该路径上所有节点的权值之和total_weight,除该路径外的余项权值remaining_weight,建立w-Uti Tree;
步骤S106:采用模式增长方式,挖掘所有高权值组合:通过递归建立初始表及子树挖掘所有高权值组合,即从初始表(Initial_Table)的最后一项开始,对初始表中的各项依次进行处理,具体包括以下子步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网公司电力科学研究院,未经广东电网公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410289711.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种速溶荞麦茶的制备方法
- 下一篇:用于电动机的反向电流保护控制
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置