[发明专利]一种星务软件模块故障复现的方法及系统在审
申请号: | 202011334417.3 | 申请日: | 2020-11-24 |
公开(公告)号: | CN112445665A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 邓兵;韩笑冬;宫江雷;安卫钰;李翔;吕小虎 | 申请(专利权)人: | 中国空间技术研究院 |
主分类号: | G06F11/22 | 分类号: | G06F11/22;G06F11/36;H04B7/185 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 陈鹏 |
地址: | 100194 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软件 模块 故障 复现 方法 系统 | ||
1.一种星务软件模块故障复现的方法,其特征在于,包括:
确定星务软件模块整个执行过程的动作集合和状态集合,以及确定所述星务软件模块出现故障时的第一动作和第一状态;
确定所述星务软件模块的初始状态,基于预设的强化学习算法、所述初始状态对所述动作集合和所述状态集合中的动作和状态进行遍历训练确定出执行每个动作后的预期未来奖励值Q,直到达到预设训练次数为止;
从所述初始状态开始根据所述Q值模拟所述星务软件模块由所述初始状态迁移到所述第一状态。
2.如权利要求1所述的方法,其特征在于,确定星务软件模块整个执行过程的动作集合和状态集合,包括:
确定所述星务软件模块的输入数据和输出数据,其中,所述输入数据和所述输出数据包括参数、变量以及指令;
根据所述输入数据以及所述输出数据预设范围分别对所述输入数据和所述输出数据进行离散化处理得到离散化的输入数据集和离散化的输出数据集;
将所述离散化的输入数据集作为所述动作集合,将所述离散化的输出数据集作为所述状态集合。
3.如权利要求2所述的方法,其特征在于,所述输出数据包括使能开关、计数参数、硬件数据以及软件数据,其中,所述计数参数为连续参数,所述硬件数据以及软件数据包括连续数据和离散数据;
所述输入数据包括输入参数和输入指令,其中,所述输入参数和输入指令包离散型输入参数和输入指令和连续型输入参数和输入指令;
根据所述输入数据以及所述输出数据预设范围分别对所述输入数据和所述输出数据进行离散化处理得到离散化的输入数据集和离散化的输出数据集,包括:根据所述预设范围对所述计数参数、所述硬件数据以及软件数据中连续数据以及所述连续型输入参数和输入指令进行离散化处理得到所述离散化的输入数据集和所述离散化的输出数据集。
4.如权利要求3所述的方法,其特征在于,基于预设的强化学习算法、所述初始状态对所述动作集合和所述状态集合中的动作和状态进行遍历训练确定出执行每个动作后的预期未来奖励值Q,包括:
确定当前训练的次数,根据所述当前训练次数和预设的训练次数最大值计算得到概率值,并随机生成一随机数,其中,所述随机数的取值范围为(0,1);
根据所述概率值以及所述随机数确定出所述初始状态对应的初始动作,执行所述初始动作得到执行结果,根据所述执行结果更新惩罚函数,根据所述惩罚函数计算出所述每个动作对应的Q值。
5.如权利要求4所述的方法,其特征在于,根据所述当前训练次数和预设的训练次数最大值确计算得到概率值,包括:
通过如下公式计算所述概率值:
e=1-(epoche/epochemax)
其中,e表示所述概率值;epoche表示当前训练次数;epochemax表示预设的训练次数最大值。
6.如权利要求5所述的方法,其特征在于,根据所述概率值以及所述随机数确定出所述初始状态对应的初始动作,包括:
判断所述随机数是否大于所述概率值;
若大于,则基于预设的最优解选择出所述初始动作;
否则,确定所述动作集合中每个动作的选取概率,根据所述选取概率随机从所述动作集合中选取出所述初始动作。
7.如权利要求6所述的方法,其特征在于,从所述初始状态开始根据所述Q值模拟所述星务软件模块由所述初始状态迁移到所述第一状态,包括:
从所述初始状态开始,每次选取Q值最大的动作进行状态迁移模拟,以使得所述星务软件模块由所述初始状态迁移到所述第一状态,且具有最少迁移次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国空间技术研究院,未经中国空间技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011334417.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种能够节约水资源的盥洗池用接水除杂机构
- 下一篇:低温复合材料气瓶设计方法