[发明专利]训练混合元学习网络的装置和方法在审
申请号: | 201910160233.0 | 申请日: | 2019-03-04 |
公开(公告)号: | CN111652664A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 杨铭;石自强;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李彦丽 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 混合 学习 网络 装置 方法 | ||
1.一种训练混合元学习网络的装置,包括:
计算泛化损失单元,被配置成利用训练数据,分别获得用于按时间排序的不同推荐任务的多个推荐神经网络中的每个推荐神经网络的损失,并基于每个推荐神经网络的损失来计算反映所述多个推荐神经网络的总体损失的泛化损失,其中,所述不同推荐任务具有相似性,每个推荐神经网络具有其输入为不存在关联的离散值的嵌入层,并且所述多个推荐神经网络的结构互不相同;
计算梯度单元,被配置成计算所述泛化损失相对于每个推荐神经网络的权重参数的梯度;
学习单元,被配置成将所述梯度分别输入到至少一个第一元学习网络中的一个第一元学习网络,从而分别获得每个推荐神经网络的权重参数的更新量,其中,所述第一元学习网络是对梯度进行学习的神经网络;
第一更新单元,被配置成基于所述更新量,更新每个推荐神经网络的权重参数;
第二更新单元,被配置成在迭代地进行所述计算泛化损失单元、所述计算梯度单元、所述学习单元以及所述第一更新单元中的处理之后满足第一预定条件时,基于在满足所述第一预定条件时的所述泛化损失,使得朝向所述多个推荐神经网络的损失更小的方向训练所述至少一个第一元学习网络,从而获得更新后的所述至少一个第一元学习网络;
第一相似度计算单元,被配置成针对所述多个推荐神经网络中的、包括第一推荐神经网络和用于紧接在所述第一推荐神经网络对应的推荐任务之后的推荐任务的第二推荐神经网络的每两个推荐神经网络,将所述第一推荐神经网络的推荐项词表和所述第二推荐神经网络的推荐项词表的交集作为活跃推荐项集,将从所述第一推荐神经网络的推荐项词表排除了所述活跃推荐项集之后获得的集合作为过时推荐项集,将从所述第二推荐神经网络的推荐项词表排除了所述活跃推荐项集之后获得的集合作为新出现推荐项集,并且分别计算所述过时推荐项集中的每个推荐项与所述新出现推荐项集中的每个推荐项相对于所述活跃推荐项集的共现词频率特征之间的第一相似度;
第二相似度计算单元,被配置成迭代地进行所述计算泛化损失单元、所述计算梯度单元、所述学习单元、所述第一更新单元、以及所述第二更新单元中的处理之后满足第二预定条件时,基于在满足所述第二预定条件时、所述每两个推荐神经网络中的所述第一推荐神经网络的所述活跃推荐项集中的推荐项的词嵌入特征和所述第二推荐神经网络的所述活跃推荐项集中的对应推荐项的词嵌入特征,通过第二元学习网络计算所述过时推荐项集中的每个推荐项与所述新出现推荐项集中的每个推荐项之间的第二相似度,其中,所述第二元学习网络是对所述第二相似度进行学习的神经网络;
相似度损失计算单元,被配置成针对所述每两个推荐神经网络计算所述第一相似度与所述第二相似度之间的相似度损失,并且使得朝向所述相似度损失更小的方向训练所述每两个推荐神经网络中的第二推荐神经网络的嵌入层的权重参数和所述第二元学习网络的权重参数,从而得到更新后的所述每两个推荐神经网络中的第二推荐神经网络的嵌入层和所述第二元学习网络;以及
第三更新单元,被配置成基于更新后的所述多个推荐神经网络的嵌入层和所述第二元学习网络,迭代地进行所述计算泛化损失单元、所述计算梯度单元、所述学习单元、所述第一更新单元、所述第二更新单元、所述第二相似度计算单元、所述计算相似度损失计算单元中的处理,直到满足第一迭代终止条件为止,
其中,所述混合元学习网络包括所述至少一个第一元学习网络和所述第二元学习网络。
2.根据权利要求1所述的装置,其中,所述多个推荐神经网络中的每个均是用于向用户推荐购物网站的物品列表的推荐神经网络。
3.根据权利要求1所述的装置,
其中,所述第二相似度计算单元被配置成学习在满足所述第二预定条件时、所述每两个推荐神经网络中的所述第一推荐神经网络的所述活跃推荐项集中的推荐项的词嵌入特征和所述第二推荐神经网络的所述活跃推荐项集中的对应推荐项的词嵌入特征之间的变换,并利用所学习到的变换将所述第一推荐神经网络的所述过时推荐项集中的推荐项的词嵌入特征映射到所述第二推荐神经网络的向量空间,从而得到映射后的推荐项的词嵌入特征,并且,所述第二相似度计算单元被配置成基于所述映射后的推荐项的词嵌入特征和所述第二推荐神经网络的所述新出现推荐项集中的推荐项的词嵌入特征,计算所述第二相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910160233.0/1.html,转载请声明来源钻瓜专利网。