[发明专利]一种基于强化学习的动力电池制造能力在线预测方法在审
申请号: | 202210098257.X | 申请日: | 2022-01-19 |
公开(公告)号: | CN114418234A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 王子赟;李南江;王艳;陈宇乾;纪志成 | 申请(专利权)人: | 江南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/04;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 张勇 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 动力电池 制造 能力 在线 预测 方法 | ||
1.一种基于强化学习的动力电池制造能力在线预测方法,其特征在于,所述方法包括:
采用m种单一预测模型分别对未来长度为N的时间内的动力电池制造能力进行预测,获得各个单一预测模型的一次预测结果;
根据各个单一预测模型的一次预测结果,基于强化学习对各单一预测模型进行优化;
利用优化后的各单一预测模型分别对未来长度为N的时间内的动力电池制造能力进行再次预测,获得各个单一预测模型的二次预测结果;
根据各个单一预测模型的二次预测结果,采用强化学习对长度为N的时间进行分割,以确定各单一预测模型的最佳权重,从而确定组合预测模型的表达式:
其中,wi是第i种单一预测模型的权重,Ni是第i种单一预测模型的分界点,fij表示第i种单一预测模型的第j个预测向量值,表示对数值a向下取整;
wi满足:
根据各单一预测模型的最佳权重确定后的组合预测模型的表达式得到动力电池制造能力预测值。
2.根据权利要求1所述的方法,其特征在于,所述单一预测模型包括循环神经网络模型和长短时记忆网络模型,m=2;所述方法包括:
步骤一:定义电池制造工艺中单位时间内制造所得到的生产量表示所述动力电池制造能力;
步骤二:定义循环神经网络模型迭代次数k1=1,长短时记忆网络模型迭代次数k2=1,权重学习迭代次数k3=1,以及对应的迭代步长N1、N2、N3,强化学习表示状态行为的循环神经网络模型的Q1表、长短时记忆网络模型的Q2表、权重学习的Q3表全为0;循环神经网络模型的最优隐含层初值l1,0和长短时记忆网络模型的最优隐含层初值l2,0,循环神经网络模型的动作矩阵A1、长短时记忆网络模型的动作矩阵A2和权重学习动作矩阵A3,组合预测模型的权重w1、w2,计算得到循环神经网络模型和长短时记忆网络模型的一次预测结果;
步骤三:利用强化学习构建隐含层学习环境,建立循环神经网络损失函数L1和长短时记忆网络损失函数L2,循环神经网络奖惩函数R1和长短时记忆网络奖惩函数R2,根据当前状态、Q1表和Q2表,利用贪婪算法选择动作行为;
步骤四:根据步骤二的一次预测结果计算损失函数L1和L2,奖惩函数R1和R2,更新Q1表和Q2表;
步骤五:令k1=k1+1和k2=k2+1,返回步骤三,直到k1=N1输出循环神经网络最优隐含层l1;当k2=N2输出长短时记忆网络最优隐含层l2,输出两个隐含层后跳转到步骤六;
步骤六:带入最优隐含层层数l1和l2,重新计算得到循环神经网络和长短时记忆网络的二次预测结果;
步骤七:构建权重学习环境,设定电池制造能力组合预测模型的状态矩阵S1和动作矩阵A3,并建立权重学习损失函数L3和奖惩函数R3,根据当前状态和Q3表,利用贪婪算法选择动作行为;
步骤八:根据步骤六的二次预测结果计算损失函数L3和奖惩函数R3,更新Q3表;
步骤九:令k3=k3+1,返回步骤七,直到k3=N3输出循环神经网络权重w1和长短时记忆网络权重w2,跳转到步骤十;
步骤十:根据步骤九的输出结果,构造基于强化学习的动力电池制造能力组合预测模型,将电池制造能力的历史数据输入所构造的基于强化学习的动力电池制造能力组合预测模型,输出电池制造能力的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210098257.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种呋喃基阻燃剂及其制备方法
- 下一篇:阿克他利药物共晶及其制备方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理