[发明专利]基于强化学习和攻防博弈的智能防御决策方法及装置有效
申请号: | 201910292304.2 | 申请日: | 2019-04-12 |
公开(公告)号: | CN110166428B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 胡浩;张玉臣;杨峻楠;谢鹏程;刘玉岭;马博文;冷强;张畅;陈周文;林野 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于网络安全技术领域,特别涉及一种基于强化学习和攻防博弈的智能防御决策方法及装置,该方法包含:在有限理性约束下构建攻防博弈模型,并生成用于提取博弈模型中网络状态与攻防动作的攻防图,该攻防图设定为以主机为中心,攻防图节点提取网络状态,攻防图边分析攻防动作;防御者在网络状态转移概率未知时,通过在线学习得到防御收益使得防御者面对不同攻击者时自动做出最优防御策略的选择。本发明有效压缩博弈状态空间,降低了存储和运行开销;防御者在与攻击者对抗中依据环境反馈进行强化学习,在面对不同攻击时能自适应做出最优选择;提升防御者学习速度,提高了防御收益,减少对历史数据依赖,有效提升防御者决策时的实时性和智能性。 | ||
搜索关键词: | 基于 强化 学习 攻防 博弈 智能 防御 决策 方法 装置 | ||
【主权项】:
1.一种基于强化学习和攻防博弈的智能防御决策方法,其特征在于,包含如下内容:A)在有限理性约束下构建攻防博弈模型,并生成用于提取博弈模型中网络状态与攻防动作的攻防图,该攻防图设定为以主机为中心,攻防图节点提取网络状态,攻防图边分析攻防动作;B)基于网络状态与攻防动作,结合攻防博弈模型,对攻防博弈过程进行强化学习,攻防双方对抗中依据环境反馈,使得有限理性下防御者面对不同攻击者时自动做出最优防御策略的选择。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910292304.2/,转载请声明来源钻瓜专利网。