[发明专利]一种基于强化学习的动力电池制造能力在线预测方法在审

申请号：	202210098257.X	申请日：	2022-01-19
公开（公告）号：	CN114418234A	公开（公告）日：	2022-04-29
发明（设计）人：	王子赟;李南江;王艳;陈宇乾;纪志成	申请（专利权）人：	江南大学
主分类号：	G06Q10/04	分类号：	G06Q10/04;G06Q50/04;G06N3/04;G06N3/08
代理公司：	哈尔滨市阳光惠远知识产权代理有限公司 23211	代理人：	张勇
地址：	214122 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于强化学习动力电池制造能力在线预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于强化学习的动力电池制造能力在线预测方法，其特征在于，所述方法包括：

采用m种单一预测模型分别对未来长度为N的时间内的动力电池制造能力进行预测，获得各个单一预测模型的一次预测结果；

根据各个单一预测模型的一次预测结果，基于强化学习对各单一预测模型进行优化；

利用优化后的各单一预测模型分别对未来长度为N的时间内的动力电池制造能力进行再次预测，获得各个单一预测模型的二次预测结果；

根据各个单一预测模型的二次预测结果，采用强化学习对长度为N的时间进行分割，以确定各单一预测模型的最佳权重，从而确定组合预测模型的表达式：

其中，w_i是第i种单一预测模型的权重，N_i是第i种单一预测模型的分界点，f_ij表示第i种单一预测模型的第j个预测向量值，表示对数值a向下取整；

w_i满足：

根据各单一预测模型的最佳权重确定后的组合预测模型的表达式得到动力电池制造能力预测值。

2.根据权利要求1所述的方法，其特征在于，所述单一预测模型包括循环神经网络模型和长短时记忆网络模型，m＝2；所述方法包括：

步骤一：定义电池制造工艺中单位时间内制造所得到的生产量表示所述动力电池制造能力；

步骤二：定义循环神经网络模型迭代次数k₁＝1，长短时记忆网络模型迭代次数k₂＝1，权重学习迭代次数k₃＝1，以及对应的迭代步长N₁、N₂、N₃，强化学习表示状态行为的循环神经网络模型的Q₁表、长短时记忆网络模型的Q₂表、权重学习的Q₃表全为0；循环神经网络模型的最优隐含层初值l_1，0和长短时记忆网络模型的最优隐含层初值l_2，0，循环神经网络模型的动作矩阵A₁、长短时记忆网络模型的动作矩阵A₂和权重学习动作矩阵A₃，组合预测模型的权重w₁、w₂，计算得到循环神经网络模型和长短时记忆网络模型的一次预测结果；

步骤三：利用强化学习构建隐含层学习环境，建立循环神经网络损失函数L₁和长短时记忆网络损失函数L₂，循环神经网络奖惩函数R₁和长短时记忆网络奖惩函数R₂，根据当前状态、Q₁表和Q₂表，利用贪婪算法选择动作行为；

步骤四：根据步骤二的一次预测结果计算损失函数L₁和L₂，奖惩函数R₁和R₂，更新Q₁表和Q₂表；

步骤五：令k₁＝k₁+1和k₂＝k₂+1，返回步骤三，直到k₁＝N₁输出循环神经网络最优隐含层l₁；当k₂＝N₂输出长短时记忆网络最优隐含层l₂，输出两个隐含层后跳转到步骤六；

步骤六：带入最优隐含层层数l₁和l₂，重新计算得到循环神经网络和长短时记忆网络的二次预测结果；

步骤七：构建权重学习环境，设定电池制造能力组合预测模型的状态矩阵S₁和动作矩阵A₃，并建立权重学习损失函数L₃和奖惩函数R₃，根据当前状态和Q₃表，利用贪婪算法选择动作行为；

步骤八：根据步骤六的二次预测结果计算损失函数L₃和奖惩函数R₃，更新Q₃表；

步骤九：令k₃＝k₃+1，返回步骤七，直到k₃＝N₃输出循环神经网络权重w₁和长短时记忆网络权重w₂，跳转到步骤十；

步骤十：根据步骤九的输出结果，构造基于强化学习的动力电池制造能力组合预测模型，将电池制造能力的历史数据输入所构造的基于强化学习的动力电池制造能力组合预测模型，输出电池制造能力的预测值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江南大学，未经江南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210098257.X/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于强化学习的动力电池制造能力在线预测方法在审

专利文献下载