[发明专利]基于GAPSO算法的最优自适应策略决策方法有效
申请号: | 201710418901.6 | 申请日: | 2017-06-06 |
公开(公告)号: | CN107229971B | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 李青山;王璐;张彦;何柳;张曼 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06N3/12 | 分类号: | G06N3/12 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 韦全生;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于PSO算法的最优自适应策略决策方法,用于解决现有技术在自适应策略空间中策略数量较为巨大的情况下决策效率低的技术问题。实现步骤为:(1)获取自适应系统的决策需求;(2)建立自适应策略空间;(3)构造适应度函数;(4)利用GA算法的交叉和变异对自适应策略空间进行计算,得到中间策略空间,并利用GA算法的选择从中间策略空间选择最优适应度函数值对应的自适应策略加入到目标策略空间,再利用PSO算法对中间策略空间中剩余的自适应策略进行更新,将更新结果加入到目标策略空间中,得到目标策略空间;(5)获取最优自适应策略。本发明具有决策效率高、适用范围广、可避免自适应策略之间的冲突的优点。 | ||
搜索关键词: | 自适应 策略空间 目标策略 适应度函数 策略决策 决策效率 自适应系统 更新结果 再利用 算法 冲突 更新 决策 | ||
【主权项】:
1.一种基于GAPSO算法的最优自适应策略决策方法,包括如下步骤:(1)获取自适应系统的决策需求:根据自适应系统的决策目标及自适应系统或计算机因素对决策目标的影响,获取对决策目标产生影响的因素和每个因素的取值,若每个因素的取值为非连续取值,则这些影响因素和每个因素的取值即为自适应系统的决策需求,若因素的取值为连续取值,对连续取值进行离散化,则这些影响因素和离散后的取值即为自适应系统的决策需求;(2)建立自适应策略空间:根据自适应系统的决策需求,利用多维表结构中的各个维度分别表示对决策目标产生影响的不同因素,并将决策需求中每个影响因素的取值分别放入到多维表结构表示该影响因素的维度中,得到所有自适应策略,所有自适应策略构成自适应策略空间;(3)构造适应度函数:利用自适应系统的决策需求、决策需求中的每个因素对决策目标的影响和每个因素的调整方式,在自适应系统和决策目标的限制和约束下,构造适应度函数;(4)利用GAPSO算法对自适应策略空间进行并行搜索:(4a)建立存放自适应策略的中间策略空间和目标策略空间,并令中间策略空间和目标策略空间均为空;(4b)利用适应度函数,计算自适应策略空间中不同自适应策略的适应度函数值,得到多个自适应策略的适应度函数值;(4c)利用GA算法,从自适应策略空间中并行选择最好适应度函数值对应的自适应策略,并将这些策略加入到目标策略空间中;(4d)利用GA算法,对步骤(4c)选择剩余的适应度函数值对应的自适应策略并行进行交叉,得到进行交叉后的自适应策略;(4e)利用GA算法,对交叉后的自适应策略并行进行变异,并将变异后的自适应策略加入到中间策略空间中;(4f)利用PSO算法,对中间策略空间中的自适应策略并行进行更新,并将并行更新后的自适应策略加入到目标策略空间中,得到包含更新后的自适应策略的目标策略空间;(5)获取最优自适应策略:(5a)确定最优自适应策略决策的终止阈值:重复执行步骤(4),得到多个目标策略空间,并利用适应度函数计算多个目标策略空间中所有自适应策略的适应度函数值,然后将满足决策目标及限制和约束条件的适应度函数值作为最优自适应策略决策终止时的适应度值阈值,同时将满足决策目标及限制和约束条件的迭代次数值作为最优自适应策略决策终止时的迭代次数阈值;(5b)判断最优自适应策略决策过程是否结束:若目标策略空间的迭代次数达到迭代次数阈值或目标策略空间中存在一个策略其适应度值达到适应度值阈值,最优自适应策略决策过程结束,目标策略空间中适应度值最优的策略即为最优自适应策略;否则,重复执行步骤(4)至步骤(5)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710418901.6/,转载请声明来源钻瓜专利网。