[发明专利]一种基于粗糙集关联规则的超高压电网故障规则挖掘方法在审
申请号: | 201310490344.0 | 申请日: | 2013-10-16 |
公开(公告)号: | CN103488802A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 梁勇超;马瑞 | 申请(专利权)人: | 国家电网公司;国网湖南省电力公司检修公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F19/00 |
代理公司: | 湖南兆弘专利事务所 43008 | 代理人: | 赵洪;谭武艺 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粗糙 关联 规则 超高压 电网 故障 挖掘 方法 | ||
1.一种基于粗糙集关联规则的超高压电网故障规则挖掘方法,其特征在于实施步骤如下:
1)从历史故障数据库获取故障数据并通过属性筛选、数据清洗建立待挖掘故障样本库;
2)采用分布式故障规则挖掘方法,把所述待挖掘故障样本库的故障数据样本按照每一个变电站下的故障设备类型进行分类分割成多个故障数据样本库;针对每一个故障数据样本库,将故障数据中涉及到的断路器和保护信号作为故障分类的条件属性集、将故障设备作为决策属性集从而得到该故障数据样本库对应的一个决策表;
3)通过运用基于信息熵的属性约简算法对所述决策表进行约简;
4)针对约简后的决策表运用Apriori算法进行关联规则挖掘故障规则;
5)建立故障规则库,按照变电站所在故障区域为第一层、故障设备类型为第二层逐层分类储存各个决策表得到的故障规则。
2.根据权利要求1所述的基于粗糙集关联规则的超高压电网故障规则挖掘方法,其特征在于,所述步骤3)的详细步骤如下:
3.1)根据式(1)计算每一个决策表中决策属性集的信息熵、根据式(2)计算决策属性集相对条件属性集的信息熵;
式(1)中,D表示决策属性集,H(D)表示信息熵,U为决策表的样本对象,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;p(Yj)为Yi在样本集上出现的概率,即某一种故障设备在故障样本中出现的概率;
式(2)中,C表示条件属性集,H(D|C)表示决策属性集D相对条件属性集C的信息熵,U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∩表示同时包含Yj和Xi;p(Xi)为Xi在样本集上出现的概率,即某一种断路器和保护装置组合在故障样本中出现的概率;p(Yj|Xi)为Xi出现时,Yi会同时出现的概率,即某一种断路器和保护装置组合动作时,某种设备故障出现的概率;
3.2)根据式(3)计算每一个决策表中条件属性集对决策属性集的互信息量;
I(C,D)=H(D)-H(D|C) (3)
式(3)中,I(C,D)代表条件属性集C对决策属性集D的互信息量,H(D)代表决策属性集D的信息熵,H(D|C)代表决策属性集D相对条件属性集C的信息熵;
3.3)计算每一个决策表中条件属性集相对决策属性集的核属性集,且记录保存非核条件属性得到非核条件属性集;
3.4)针对非核条件属性集中的任意元素,计算器对决策属性集的互信息量,找出使得互信息量最大的非核条件属性作为重要属性,得到重要属性集;
3.5)计算所述重要属性集对决策属性集的互信息量,如果所述重要属性集对决策属性集的互信息量的值与条件属性集对决策属性集的互信息量的值相等,则将核属性集作为约简后的决策表,并跳转执行步骤4);否则跳转执行步骤3.4)。
3.根据权利要求2所述的基于粗糙集关联规则的超高压电网故障规则挖掘方法,其特征在于,所述步骤4)的详细步骤如下:
4.1)根据式(4)设定支持度阈值和置信度阈值;
Support=|Xi∨Yj|/|U| (4)
Confidence=|Xi∧Yj|/|Xi|
式(4)中,Support表示支持度阈值,Confidence表示置信度阈值;U为决策表的样本对象,X={X1,X2,...,Xn}是决策表的样本对象U中根据条件属性集C分成的等价类的集合,Y={Y1,Y2,...,Ym}是决策表的样本对象U中根据决策属性集D分成的等价类的集合;∧表示逻辑运算“与”,表示Xi出现的同时Yj也同时出现;
4.2)把条件属性集和决策属性集取值用“0”和“1”来表示,从而将约简后的决策表转化为基于布尔属性的新决策表;将新决策表针对条件属性集和决策属性集运用Apriori算法首先生成频繁1项集,分别删除其中支持度小于所述支持度阈值的项并得到在符合条件的条件属性1项集、决策属性1项集;在所述符合条件的条件属性1项集、决策属性1项集的基础上根据式(5)运用Apriori算法继续生成频繁i项集:
LCi=LCi-1×LC1(1<i≤条件属性集的长度) (5)
LDj=LDj-1×LD1(1<j≤决策属性集的长度)
式(5)中,LC1代表符合条件的条件属性1项集、LD1代表符合条件的决策属性1项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集,LCi-1代表针对条件属性集生成的频繁i-1项集,LDj-1代表针对决策属性集生成的频繁j-1项集;×表示连接符号,表示将两个项集组合在一起;
4.3)将每一轮针对条件属性集生成的频繁i项集、针对决策属性集生成的频繁j项集根据式(6)进行连接运算生成长度为i+j的频繁项集,将所述频繁项集中支持度大于或等于支持度阈值、置信度大于或等于置信度阈值的频繁项集放入规则集;
Li+j=LCi×LDj (6)
式(6)中,Li+j代表生成的长度为i+j的频繁项集,LCi代表针对条件属性集生成的频繁i项集,LDj代表针对决策属性集生成的频繁j项集;×为连接符号,表示将两个项集组合在一起;
4.4)对所述规则集中的规则进行合并优化作为挖掘得到的故障规则存入规则库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网湖南省电力公司检修公司,未经国家电网公司;国网湖南省电力公司检修公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310490344.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自适应无线组网波形记录系统
- 下一篇:带绕线器的耳机