[发明专利]基于马尔可夫决策过程的输变电设备最佳检修决策方法有效
申请号: | 201610865179.6 | 申请日: | 2016-09-29 |
公开(公告)号: | CN106447201B | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 杨祎;牛进苍;张方正;李红梅;田兵;李勇;杜修明;郭志红;陈玉峰;盛戈皞;辜超;周加斌;郑建;马艳;林颖;李程启;耿玉杰;白德盟;侯慧娟;贾京苇 | 申请(专利权)人: | 国网山东省电力公司电力科学研究院;上海交通大学;国网山东省电力公司;国家电网公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G06F17/50 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250002 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于马尔可夫决策过程的输变电设备最佳检修决策方法,包括:建立不同状态之间的转移关系的输变电设备状态转移关系图;根据输变电设备状态转移关系图建立输变电设备状态检修模型;利用马尔可夫过程求解输变电设备不同状态的稳态概率;建立检修策略以及检修策略对应的报酬之间的函数关系式;以在检修策略下使得报酬序列的某个函数值最大为序列决策问题的目标建立基于马尔可夫的输变电设备检修决策模型;根据输变电设备不同状态的稳态概率,采用策略迭代法求解最优的检修决策。本发明有益效果:应用马尔可夫决策可以折中维修成本和故障损失,得到经济最优的检修决策,为检修决策人员提供参考。 | ||
搜索关键词: | 基于 马尔可夫 决策 过程 变电 设备 最佳 检修 方法 | ||
【主权项】:
1.基于马尔可夫决策过程的输变电设备最佳检修决策方法,其特征是,包括:(1)设定输变电设备的状态形式,建立不同状态之间的转移关系的输变电设备状态转移关系图;所述步骤(1)中,如果输变电设备安装了在线监测装置,则建立CBM模型;该模型下输变电设备的状态形式包括:老化状态D,检查状态I、检修状态M和故障状态F;其中,老化状态D按照老化严重程度依次划分为正常状态D1、注意状态D2和异常状态D3;检修状态分为小修和大修;从老化状态Di到老化状态Di+1的平均时间观测值的倒数定义为从老化状态Di到老化状态Di+1的状态转移率λi;状态Di的两次检查平均间隔时间的倒数定义为状态Di的检查率γi;检查状态持续时间的倒数定义为状态转移率δ;维修状态持续时间的倒数定义为状态转移率μ;所述步骤(1)中,如果输变电设备没有安装在线监测装置,则建立IBM模型;该模型下输变电设备的状态形式包括:老化状态D,检查状态I、检修状态M和故障状态F;其中,老化状态D按照老化严重程度依次划分为正常状态D1、注意状态D2,1、D2,2和异常状态D3,1、D3,2和D3,3;检修状态分为小修和大修;从老化状态Di到老化状态Di+1的平均时间观测值的倒数定义为从老化状态Di到老化状态Di+1的状态转移率λi;状态Di的两次检查平均间隔时间的倒数定义为状态Di的检查率γi;检查状态持续时间的倒数定义为状态转移率δ;维修状态持续时间的倒数定义为状态转移率μ;(2)根据输变电设备状态转移关系图建立输变电设备状态检修模型;(3)利用马尔可夫过程求解输变电设备不同状态的稳态概率;(4)建立检修策略以及检修策略对应的报酬之间的函数关系式;以在检修策略π下使得报酬序列ν的某个函数值最大为序列决策问题的目标建立基于马尔可夫的输变电设备检修决策模型;所述步骤(4)中,基于马尔可夫的输变电设备检修决策模型用一个包含五个元素的元组<T,S,A,p,r>来描述,其中:1)T为所有决策时刻的点集,即选取行动的时间点被称为决策时刻,为有限点集或可列无限点集;对于离散模型,两个相邻的决策时刻被称为决策周期或者阶段;2)S是系统所有可能的状态所组成的非空的可数状态集,也称为状态空间;3)A为对应i∈S在该状态可采用的行动集合,每个状态都存在着有限集;4)p表示系统动态的状态转移特性;p(sn+1|sn,an)表示当系统处于状态sn,并采取行动an∈A时,系统在状态转移后处于状态sn+1的概率;5)r表示期望报酬,系统在状态sn采取了行动an∈A所获得的期望报酬记为r(sn,an);所述步骤(4)中,引入折扣率β∈(0,1)来表示未来时刻的报酬在当前时刻的价值;则系统从状态sn出发的折扣期望报酬为:其中,ν(sn,π)为检修策略π对应着的报酬序列;p(sn+1|sn,π)为当系统处于状态sn,并采取检修策略π时,系统在状态转移后处于状态sn+1的概率(5)根据输变电设备不同状态的稳态概率,采用策略迭代法求解最优的检修决策;所述步骤(5)中,采用策略迭代法求解最优的检修决策具体方法为:步骤一:取初值,设迭代步数n=0,任取一种初始检修策略π∈Π;步骤二:检修策略求值,解方程:(I‑βP(πn))ν=r(πn);其中,I为单位矩阵,P(πn)为转移概率矩阵;r(πn)为报酬矩阵;β为折扣率;ν为期望报酬值;得到当前策略的期望报酬值Vβ(πn);步骤三:检修策略的改进,选取πn+1为一个Vβ(πn)的改进规则,即满足:步骤四:如果πn+1=πn,停止,此时,πn+1=πn为最优检修策略,Vβ(πn+1)=Vβ(πn)为最优期望报酬;否则令n=n+1,返回到步骤二。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司电力科学研究院;上海交通大学;国网山东省电力公司;国家电网公司,未经国网山东省电力公司电力科学研究院;上海交通大学;国网山东省电力公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610865179.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理