[发明专利]一种提高服务组合可信性的自适应维护方法无效
申请号: | 200810056341.5 | 申请日: | 2008-01-16 |
公开(公告)号: | CN101488880A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 怀进鹏;郭慧鹏;邓婷;李扬;杜宗霞;曾晋 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京北新智诚知识产权代理有限公司 | 代理人: | 陈 曦 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 服务 组合 可信性 自适应 维护 方法 | ||
1.一种提高服务组合可信性的自适应维护方法,将服务组合作为被 控对象,服务保证策略作为相应的控制器,由所述服务组合和所述服务 保证策略构成闭环反馈控制系统,其特征在于:
在所述闭环反馈控制系统中,将对服务组合的可信性的期望值作为 给定量,所述给定量输入所述控制器,获得所述可信性的调整量,所述 调整量进入构造器,所述构造器的输出进入服务缓冲池和组合缓冲池;
所述服务缓冲池和组合缓冲池的信息通过监测评估器后,生成所述 可信性的实际值;
所述可信性的实际值与期望值结合,反馈给所述控制器;
服务注册库将所述可信性的变化反馈给所述服务缓冲池、组合缓冲 池和监测评估器。
2.如权利要求1所述的提高服务组合可信性的自适应维护方法,其 特征在于:
所述控制器通过服务组合可信性维护的马尔可夫决策模型实现。
3.如权利要求2所述的提高服务组合可信性的自适应维护方法,其 特征在于:
所述马尔可夫决策模型中,采用了强化学习算法获得最优决策策略;
所述强化学习算法中,把状态一动作对的奖赏作为值函数,首先对 当前状态s和动作a的所有组合,设定值函数的初始估计为0,然后观察 当前状态s,一直重复做:选择和执行动作a,接受瞬时奖赏r;观察 新状态s’,按照S←S’更新估计值;
在强化学习过程中,如果执行某个动作a后获得环境正的奖赏,则 之后增强继续应用该策略的趋势,反之则降低这种趋势;
由此不断根据环境的反馈学习出真实的值函数,进而得到最优决策 策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810056341.5/1.html,转载请声明来源钻瓜专利网。