[发明专利]基于多主体随机决策过程的分布式系统自愈调控方法有效
申请号: | 200910071280.4 | 申请日: | 2009-01-16 |
公开(公告)号: | CN101478433A | 公开(公告)日: | 2009-07-08 |
发明(设计)人: | 王慧强;卢旭;赵国生 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;G06F11/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001黑龙江省哈尔滨市南岗区南通*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主体 随机 决策 过程 分布式 系统 自愈 调控 方法 | ||
(一)技术领域
本发明涉及的是计算机系统的失效自愈方法,特别涉及分布式系统失效自愈技术领域。
(二)背景技术
分布式系统的异构性、复杂性和使用环境的不断恶化不可避免地导致了系统失效、偏离使命、甚至中断运行、崩溃死机等现象发生,从而造成重大的经济损失甚至是人员伤亡等严重后果。这也使得人工完成其管理和维护、不间断地保持其正常运转变得越来越困难。而传统的可靠性、维修性理论和技术面对这种随时可能出现的随机事件又显得过于笨拙,甚至束手无措,难以满足实际应用的需要,细粒度的恢复技术如微重启技术、任务热插拔技术以及系统级的悔改技术使得分布式系统多层次恢复机机制成为可能,同时人们期望有一种自动而灵活的自动恢复策略生成方法来解决多种恢复手段下恢复方法的选择与优化问题,自愈调控技术正是基于以上理念而提出的。
尽管国内外对于可自愈的分布式系统研究较多,但对于多层恢复机制下自愈系统恢复策略生成问题的研究关注较少,当前对于该问题主要有两种比较相关的研究思路:一种以基于决策树的多主体自愈分布式系统研究为代表,2005年国际电气电子工程师协会(IEEE)举办的第三届软件工程研究、管理和应用会议论文《基于多主体技术的先验式自愈系统》(Proactive self-healing system basedon multi-agent technologies,In The Third ACIS international Conferenceon Software Engineering Research,Management and Applications,2005,onpage(s):256-263)中提出的多主体自愈系统,通过建立监控主体、构件主体、执行主体、诊断主体和决策主体来实现系统自愈,其中决策主体采取决策树方法来产生恢复策略,其问题是采取单个主体来负责决策,属于集中式解决方案,不适用与开放、动态的分布式系统;第二种方法以基于部分可观察马尔可夫决策过程(POMDP)的模型驱动自愈系统研究为代表,2005年国际电气电子工程师协会举办的第二十四届可靠分布式系统会议上发表的论文《模型驱动的分布式系统自恢复》(Automatic model-driven recovery in distributed systems,24th IEEESymposium on Reliable Distributed Systems,on page(s):25-36)提出的利用部分可观察马尔可夫决策过程实现恢复策略自动生成,这类方法同样没有考虑到分布式系统分散控制,动态交互的特点,且恢复策略求解计算量大,较难以满足当前分布式系统应用中实时在线恢复的要求。
多主体马尔可夫决策过程(MMDP:Multi-Markov decision process)是研究一系列大规模随机序贯决策问题的理论。所谓随机序贯决策问题,是指在一系列相继的或连续的时刻(称为决策时刻)点上做出决策,在每个决策时刻点,决策者根据观测到的状态从可用的若干决策中选择一个,将决策付诸实施后,系统将获得与所处状态和所采决策有关的一项报酬,并影响系统在下一个决策时刻点所处的状态,所谓多主体决策即在系统中决策主体不唯一,且决策主体之间具备协调通信机制,能够实现基本的交互功能,多主体决策的目的是使系统的运行在某种准则下达到最优。本发明公布的多主体随机决策方法实现自愈调控方面的应用目前未见发现。
(三)发明内容
本发明的目的在于提供一种能够克服现有自愈调控技术在分布式系统多层恢复机制下不能生成优化的恢复策略,以及恢复策略求解计算量大和决策机制易于失效的缺陷的基于多主体随机决策过程的分布式系统自愈调控方法。
本发明的目的是这样实现的:
包括以下步骤:
(1)在系统首次运行前,按照功能耦合性将系统划分为多个子系统,每一个子系统具备一个决策主体,并对每一个子系统构建随机决策五元组{S,A(i),pij(a),r(i,a),V,},包括系统状态,系统行为,状态转移概率矩阵,准则函数并设定折扣因子γ,γ满足条件γ>0,五元组的所有信息保存则决策主体所在节点上;
(2)对于每一个决策主体,保存一个恢复行为记录表用于判断恢复行为是否会影响本身子系统外其他子系统的可用性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910071280.4/2.html,转载请声明来源钻瓜专利网。