[发明专利]基于多源样本迁移强化学习的智能加工刀具磨损预测方法有效
申请号: | 202011462218.0 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112518425B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 杨文安;刘学为;郭宇 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | B23Q17/09 | 分类号: | B23Q17/09 |
代理公司: | 北京中知法苑知识产权代理有限公司 11226 | 代理人: | 李明;赵吉阳 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 迁移 强化 学习 智能 加工 刀具 磨损 预测 方法 | ||
1.一种基于多源样本迁移强化学习的智能加工刀具磨损预测方法,其特征在于,包括以下步骤:
步骤一:构建基于多源迁移强化学习的智能加工刀具磨损预测系统,其中,所述智能加工刀具磨损预测系统包括刀具状态虚拟检测对象,所述刀具状态虚拟检测对象为不同的刀具;
步骤二:根据几种刀具的不同磨损曲线获取多个源任务及一个目标任务;
步骤三:初始化模型参数及最大迭代时间;
步骤四:检测当前刀具的磨损状态,对磨损数据进行特征提取及降维,构建加权极限学习机的训练样本集,并训练加权极限学习机;
步骤五:执行加工动作,观察当前刀具的磨损状态,并同时观察刀具的下一个磨损状态及回报,计算各源任务和目标任务之间的状态相似度和回报相似度;
步骤六:计算源任务中各样本属于目标样本集的概率,并基于该概率对每个刀具磨损源任务的样本进行降序排列;
步骤七:获取任务相似度,并将固定个数的样本从每个源样本集迁移到目标样本集;
步骤八:利用基于加权极限学习机的Q学习机制更新Q值,并将新的刀具磨损数据添加到目标样本集中,然后向前滚动时间窗口以丢弃最旧的样本;
步骤九:构建粒子滤波模型的状态方程及观测方程;以及
步骤十:对智能加工的刀具磨损状态进行预测,
其中,在所述步骤四中,利用在线及离线测量的方法检测当前刀具的磨损状态,并对磨损数据进行特征提取及降维后用于构建训练样本集。
2.根据权利要求1所述的智能加工刀具磨损预测方法,其特征在于,在所述步骤五中,利用得到的状态相似度和回报相似度来量化源任务各样本与目标任务之间的相似程度;在所述步骤六中,将所述状态相似度及所述回报相似度用于计算源任务中各样本属于目标样本集的概率。
3.根据权利要求1所述的智能加工刀具磨损预测方法,其特征在于,在所述步骤六中,将源任务中各样本属于目标样本集的概率作为样本迁移权值,该值决定了样本迁移的可能性大小。
4.根据权利要求1所述的智能加工刀具磨损预测方法,其特征在于,在所述步骤七中,根据贝叶斯概率分析理论计算任务相似度,该值用于决定从每个源任务迁移到目标任务集的样本数目。
5.根据权利要求1所述的智能加工刀具磨损预测方法,其特征在于,在所述步骤八中,利用不同的概率来选择最大Q值或随机Q值来更新Q值。
6.根据权利要求1所述的智能加工刀具磨损预测方法,其特征在于,在所述步骤八中,滚动时间窗口用于更新目标样本集,避免样本集过大导致加权极限学习机的学习速度过慢。
7.一种基于多源样本迁移强化学习的智能加工刀具磨损预测系统,其特征在于,所述能加工刀具磨损预测系统包括存储器和处理器,所述存储器上存储有指令,当所述指令被所述处理器执行时实现根据权利要求1-6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011462218.0/1.html,转载请声明来源钻瓜专利网。