[发明专利]信息处理方法和信息处理装置在审
申请号: | 201910066435.9 | 申请日: | 2019-01-24 |
公开(公告)号: | CN111476257A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 钟朝亮;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;王鹏 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 | ||
1.一种信息处理方法,用于将第一智能体的处理知识转移到第二智能体,其中所述第一智能体能够根据所述第一智能体的观测信息执行相应的动作序列,所述信息处理方法包括:
生成所述第一智能体的第一动作序列和所述第二智能体的第二动作序列的动作序列对,其中所述第一动作序列和所述第二动作序列完成相同的任务;
使用所生成的动作序列对训练映射模型,其中所述映射模型能够根据所述第一智能体的动作序列生成所述第二智能体的动作序列;
使用所述第一智能体的第一动作序列训练判断模型,其中所述判断模型能够判断所述第一智能体的动作序列的当前动作是否是该动作序列的最后一个动作;以及
使用经训练的映射模型和经训练的判断模型构造映射库,其中所述映射库包括从所述第二智能体的观测信息到所述第二智能体的动作序列的映射。
2.根据权利要求1所述的信息处理方法,其中所述第一智能体的动作的自由度不同于所述第二智能体的动作的自由度。
3.根据权利要求1所述的信息处理方法,其中通过使用不同的任务构造不同的所述动作序列对。
4.根据权利要求1所述的信息处理方法,其中使用所述动作序列对训练映射模型的步骤进一步包括:
设置所述第一智能体的动作的第一索引,使用表示所述第一索引的第一索引向量表示所述第一智能体的第一动作序列;
设置所述第二智能体的动作的第二索引,使用表示所述第二索引的第二索引向量表示所述第二智能体的第二动作序列;以及
使用所述第一索引向量和所述第二索引向量训练所述映射模型。
5.根据权利要求1所述的信息处理方法,其中使用所述第一动作序列训练判断模型的步骤进一步包括:
设置所述第一智能体的动作的第一索引,使用表示所述第一索引的第一索引向量表示所述第一智能体的第一动作序列;以及
使用所述第一索引向量训练所述判断模型。
6.根据权利要求1所述的信息处理方法,其中
所述映射模型包括编码单元和解码单元,
所述编码单元被配置成将所述第一智能体的动作序列编码为固定长度向量,以及
所述解码单元被配置成将所述固定长度向量解码为所述第二智能体的动作序列。
7.根据权利要求1所述的信息处理方法,其中
所述映射模型包括编码单元和解码单元,
所述编码单元被配置成将所述第一智能体的动作序列的逆序列编码为固定长度向量,以及
所述解码单元被配置成将所述固定长度向量解码为所述第二智能体的动作序列的逆序列。
8.根据权利要求1所述的信息处理方法,其中使用经训练的映射模型和经训练的判断模型构造映射库的步骤进一步包括:
所述第一智能体根据与所述第一智能体的观测信息相关的环境信息执行由所述第一智能体的动作序列构成的动作流;
使用经训练的判断模型从所述动作流中提取所述第一智能体的动作序列;
使用经训练的映射模型根据所提取的所述第一智能体的动作序列生成所述第二智能体的动作序列;以及
构造从所述第二智能体的观测信息到所生成的所述第二智能体的动作序列的映射。
9.根据权利要求1所述的信息处理方法,进一步包括:
使用所述映射库对第二智能体进行训练。
10.一种信息处理装置,用于将第一智能体的处理知识转移到第二智能体,其中所述第一智能体能够根据所述第一智能体的观测信息执行相应的动作序列,所述信息处理装置包括:
生成单元,被配置成生成所述第一智能体的第一动作序列和所述第二智能体的第二动作序列的动作序列对,其中所述第一动作序列和所述第二动作序列完成相同的任务;
第一训练单元,被配置成使用所生成的动作序列对训练映射模型,其中所述映射模型能够根据所述第一智能体的动作序列生成所述第二智能体的动作序列;
第二训练单元,被配置成使用所述第一智能体的第一动作序列训练判断模型,其中所述判断模型能够判断所述第一智能体的动作序列的当前动作是否是该动作序列的最后一个动作;以及
构造单元,被配置成使用经训练的映射模型和经训练的判断模型构造映射库,其中所述映射库包括从所述第二智能体的观测信息到所述第二智能体的动作序列的映射。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910066435.9/1.html,转载请声明来源钻瓜专利网。