[发明专利]机器学习装置、控制装置以及机器学习方法有效
申请号: | 201910280101.1 | 申请日: | 2019-04-09 |
公开(公告)号: | CN110376964B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 梁瑶;恒木亮太郎 | 申请(专利权)人: | 发那科株式会社 |
主分类号: | G05B19/404 | 分类号: | G05B19/404 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 范胜杰;金慧善 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 装置 控制 以及 学习方法 | ||
1.一种机器学习装置,其对具备校正生成部和限制部的伺服控制装置进行与上述校正生成部的校正量的最佳化有关的机器学习,其中,上述校正生成部生成添加在对驱动机床、机器人或者工业机械的轴的伺服电动机进行控制的控制指令的校正量,上述限制部将上述校正量或者添加了上述校正量的控制指令限制在设定范围内,其特征在于,
在机器学习动作中,在上述伺服控制装置中上述校正量或者添加了上述校正量的上述控制指令成为上述设定范围外,且上述限制部对上述校正量或者添加了上述校正量的上述控制指令加以限制而成为上述设定范围内的情况下,在上述机器学习装置中,将上述校正量反映到学习中,继续进行将由上述校正生成部生成的上述校正量最佳化的新的搜索。
2.根据权利要求1所述的机器学习装置,其特征在于,
上述限制部在对上述校正量或者添加了上述校正量的上述控制指令加以限制的情况下,将上述校正量或者添加了上述校正量的上述控制指令成为上述设定范围外的情况通知给上述机器学习装置,
上述机器学习装置在接受到上述通知时,将上述校正量反映到学习中。
3.根据权利要求1或2所述的机器学习装置,其特征在于,
作为上述机器学习而进行强化学习,
从上述限制部接受到上述通知时,给予不选择上述校正量或者添加了上述校正量的上述控制指令超过上述设定范围那样的上述校正量的回报。
4.根据权利要求3所述的机器学习装置,其特征在于,
基于上述回报更新价值函数,并基于更新后的价值函数,生成最佳的上述校正量或者校正参数的调整信息,并输出到上述校正生成部。
5.根据权利要求1或2所述的机器学习装置,其特征在于,
上述控制指令包括速度指令和转矩指令中的至少一个,上述校正量包括对上述速度指令添加的位置前馈项和对上述转矩指令添加的速度前馈项中的至少一个。
6.根据权利要求1或2所述的机器学习装置,其特征在于,
上述设定范围是上限和下限被固定的范围。
7.根据权利要求1或2所述的机器学习装置,其特征在于,
上述设定范围是上限和下限变动的范围。
8.根据权利要求7所述的机器学习装置,其特征在于,
上述限制部根据加工精度或者加工周期时间来改变上述设定范围的上限和下限。
9.一种控制装置,其特征在于,具备:
权利要求1~8中任一项所述的机器学习装置;以及
伺服控制装置,具备:校正生成部,其生成添加在对驱动机床、机器人或者工业机械的轴的伺服电动机的进行控制的控制指令的校正量;以及限制部,其将上述校正量或者添加了上述校正量的控制指令限制在设定范围内。
10.根据权利要求9所述的控制装置,其特征在于,
上述机器学习装置包含于上述伺服控制装置。
11.一种机器学习装置的机器学习方法,上述机器学习装置对伺服控制装置进行与校正量的最佳化有关的机器学习,其中,上述伺服控制装置生成添加在对驱动机床、机器人或者工业机械的轴的伺服电动机的进行控制的控制指令的校正量,将校正量或者添加了上述校正量的控制指令限制在设定范围内,其特征在于,
在机器学习动作中,在上述伺服控制装置中上述校正量或者添加了上述校正量的上述控制指令成为上述设定范围外,且对上述校正量或者添加了上述校正量的上述控制指令加以限制而成为上述设定范围内的情况下,在上述机器学习装置中,将上述校正量反映到学习中,继续进行将上述校正量最佳化的新的搜索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于发那科株式会社,未经发那科株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910280101.1/1.html,转载请声明来源钻瓜专利网。