[发明专利]一种基于大数据互信息属性约简的配电网可靠性评估方法有效
申请号: | 201710244420.8 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107169628B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 李妍;盛梦雨;刘婉兵;杜明秋;杨秉臻;杨晨光;王少荣 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G06N3/08 |
代理公司: | 武汉天力专利事务所 42208 | 代理人: | 吴晓颖 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 互信 属性 配电网 可靠性 评估 方法 | ||
1.一种基于大数据互信息属性约简的配电网可靠性评估方法,其特征是该方法包括以下步骤:
(1)从学术、气象或统计网站上收集大量与配电网可靠性相关的数据;
(2)从众多数据中整理出一份表征可靠性指标和相关指标对应关系的决策表,其中包括1个表示最终配电网可靠性高低的决策属性即可靠性指标和多个表示与可靠性相关的因素的条件属性;具体方式如下:
步骤一,根据所收集的与某市配电网可靠性相关的大量数据建立一份m×n的配电网可靠性评估决策表,其中n表示决策属性和条件属性的总个数,对应的决策属性和条件属性构成一组属性数据,m表示属性数据的总组数即样本数;
步骤二,将决策表中直接表示或决定配电网可靠性的指标作为决策属性,其余与可靠性相关的指标作为条件属性;
(3)对决策表中的数据进行预处理:根据各种属性的所有取值,判断属性的取值是连续的还是离散的,对于连续型属性,计算出其应该被划分的数目,并用等距离散法将连续型属性离散化;具体方式如下:
步骤一,根据决策表中所有属性的取值,判断属性数据是连续的还是离散的;
步骤二,按照各个因素的数据分布特性及相关客观因素,根据以下公式计算连续型属性应该被划分的分区数;
k=1.87×(m-1)2/5
式中,m为属性数据的样本数,k为连续属性值域的分区数;
步骤三,根据算得的分区数计算连续型属性的区间长度,对每个区间赋一个离散的整数值,并计算连续型属性的离散化结果,完成连续数据的离散化;
(4)计算每种属性取到特定离散值时的概率,然后求出每种属性各自的信息熵和条件属性对于决策属性的条件熵,进而求得各种条件属性与决策属性之间的互信息,以及一种条件属性和另一种条件属性之间的互信息;具体方式如下:
步骤一,统计每个属性取到每个离散整数值的样本数,根据以下公式计算属性取到特定离散值时的概率,
式中,k表示属性x的离散化分区数,Xi表示属性x的第i个取值,c(Xi)表示属性x取值为Xi的样本数,U表示总样本即论域,c(U)表示总样本数,p(Xi)表示属性x取值为Xi的概率;
步骤二,根据以下公式求出每种属性各自的信息熵、条件属性对于决策属性的条件熵和某一种条件属性对于另一条件属性的条件熵;
式中,H(x)表示属性x的信息熵;
式中,p(Yj|Xi)表示在Xi发生的前提下,Yj发生的概率,H(y|x)表示属性y对于x的条件熵或基于x的y的条件熵;
步骤三,利用上步的计算结果,根据以下公式求得每种条件属性与决策属性之间的互信息,以及一种条件属性和另一种条件属性之间的互信息,
I(x,y)=H(y)-H(y|x)
式中,H(y)表示属性y的信息熵,I(x,y)表示属性x与y的互信息,是属性y与x共有的信息量;
(5)对步骤(4)中算得的条件属性与决策属性之间的互信息进行归一化,结合信息熵求取条件属性和决策属性之间的熵相关系数,根据熵相关系数的计算结果设置一个临界值e1,当某种条件属性与决策属性的熵相关系数小于该临界值时,将其从决策表中剔除;具体方式如下:
步骤一,利用以下公式对算得的条件属性与决策属性的互信息进行归一化,求取熵相关系数值,
式中,ρxy为属性x与y的熵相关系数,表示x与y的相关程度;
步骤二,根据熵相关系数的计算结果设置一个临界值e1,当某种条件属性与决策属性的熵相关系数小于该临界值时,将其从决策表中剔除;
(6)计算由步骤(5)剔除后剩余的条件属性相互间的熵相关系数,根据熵相关系数的取值设置一个临界值e2,当两个条件属性的熵相关系数超过该临界值时,判断两个条件属性对于配电网可靠性的影响相同,此时再比较这两个条件属性与决策属性之间的熵相关系数,删除与决策属性之间的熵相关系数小的条件属性,得到约简后的条件属性集;
(7)构造三层BP神经网络对约简后的条件属性集进行训练,以由步骤(6)得到的条件属性作为输入,以决策属性数据作为输出,求得使拟合误差最小的网络中各层节点之间的连接权重和隐含层、输出层的阈值,得到最佳的BP神经网络模型;具体方式如下:
步骤一,构造三层BP神经网络对约简后的属性数据进行训练,以得到的条件属性作为输入,以决策属性作为最终的输出;假设约简后的决策表中有p种条件属性,则输入层和输出层的节点个数分别为p和1;在m组属性数据中随机选择b个测试样本,其余样本作为神经网络的训练样本,样本中包括条件属性和决策属性值,对样本中的数据进行归一化处理;
步骤二,用计算机随机生成h组BP神经网络中各层节点的初始连接权重和隐含层、输出层的阈值,将其改写为二进制编码形式,构成初始解空间,结合神经网络计算出解空间中解数据的适应度;选出适应度较大的前c个解数据作为父代解数据,对父代解数据进行交叉、变异操作得到子代解空间,根据子代解数据的适应度判断是否收敛,如果是,则寻优停止并输出最优初始权重和阈值,否则,继续进行选择、交叉、变异操作;
步骤三,对上步算得的初始权重和阈值解码,用BP神经网络训练归一化处理后的样本,得到决策属性的估计值和真实值的误差,判断该误差是否满足收敛条件,若不满足,则调整权重和阈值,继续训练网络;若满足,则停止循环,输出使误差最小的权重和阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710244420.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防滑免碰撞型浴缸
- 下一篇:一种集成式强制淋浴装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置