[发明专利]一种基于改进的Q-learning的最优决策方法在审
申请号: | 202011514716.5 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112598137A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 蒋雯;黄方慧;耿杰;邓鑫洋 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06N20/10 | 分类号: | G06N20/10 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 710072 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于改进的Q‑learning的最优决策方法,包括以下步骤:步骤一、非线性系统模型构建;步骤二、马尔科夫模型构建;步骤三、Q‑learning算法求解;步骤四、Q‑learning算法中改进的动作选择策略;步骤五、改进的Q‑learning算法更新决策。本发明采用改进的Q‑learning算法实现非线性系统的最优决策,通过采用改进的动作选择策略进行系统的动作选择,解决了Q‑learning算法中的探索开发平衡问题,并使算法收敛速度快;本发明提出的改进的Q‑learning算法可以在无系统先验信息或系统数据的情况下实现对非线性离散系统的最优决策。 | ||
搜索关键词: | 一种 基于 改进 learning 最优 决策 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011514716.5/,转载请声明来源钻瓜专利网。