[发明专利]行为信息学习装置、机器人控制系统及行为信息学习方法有效

申请号：	201810258132.2	申请日：	2018-03-27
公开（公告）号：	CN108693851B	公开（公告）日：	2020-05-26
发明（设计）人：	山本知之;栗原佑典	申请（专利权）人：	发那科株式会社
主分类号：	G05B19/42	分类号：	G05B19/42
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	范胜杰;赵宇
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种行为信息学习装置、机器人控制系统及行为信息学习方法，用于使作业者容易进行与机器人的协作作业。行为信息学习装置(300)具备：状态信息取得部(310)，其在机器人(100)将从工件放置处取得的工件(7)在交接工件的区域即工件交接区域(8)内交接给作业人员(P)时，取得机器人的状态(s)；行为信息输出部(320)，其输出状态的调整信息即行为(a)；回报计算部(331)，其取得关于工件的交接所花费的交接时间(T)的信息即判定信息，并根据所取得的判定信息来计算强化学习的回报的值；以及价值函数更新部(332)，其根据回报的值、状态(s)、行为(a)进行强化学习，从而更新价值函数(Q)。
搜索关键词：	行为信息学习装置机器人控制系统学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种行为信息学习装置，其特征在于，该行为信息学习装置具备：状态信息取得单元，其在机器人将从工件放置处取得的工件在交接工件的区域即工件交接区域内交接给作业人员时，取得上述机器人的状态信息；行为信息输出单元，其输出上述状态信息的调整信息即行为信息；回报计算单元，其取得与工件的交接所花费的交接时间有关的信息即判定信息，并根据所取得的上述判定信息来计算强化学习的回报的值；以及价值函数更新单元，其根据通过上述回报计算单元计算出的上述回报的值、上述状态信息以及上述行为信息来进行上述强化学习，由此更新价值函数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于发那科株式会社，未经发那科株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810258132.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G05 控制；调节
G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置
G05B19-00 程序控制系统
G05B19-02 .电的
G05B19-43 .流体的
G05B19-44 ..气动的
G05B19-46 ..液压的
G05B19-04 ..除数字控制外的程序控制，即顺序控制器或逻辑控制器

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]行为信息学习装置、机器人控制系统及行为信息学习方法有效

专利文献下载