[发明专利]一种基于动态递归机制的分层强化学习的推荐系统有效
申请号: | 202011564657.2 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112597391B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 林元国;林凡;曾文华;夏侯建兵;张志宏 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06N20/00 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 何家富 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于动态递归机制的分层强化学习的推荐系统,包括用户画像矫正器:采用一种动态递归机制的策略梯度方法,及引入参数动态稀疏权重以删除噪声数据来修改用户画像,其中,所述动态递归机制的策略梯度方法包括:动态基线和基于时序上下文的递归强化学习,所述动态基线为采用动态稀疏权重对总收益进行学习策略的改进;注意力机制:用于自动调整用户偏好的变化;推荐模型:用于通过注意力机制向用户推荐最相关物品。本发明的推荐系统,通过在策略梯度方法中引入一个参数动态稀疏权重,使智能体在全局最优策略下选择最优行为;其次,结合时间上下文的分层强化学习,该方法能够更可靠地收敛,从而提高模型预测的稳定性。 | ||
搜索关键词: | 一种 基于 动态 递归 机制 分层 强化 学习 推荐 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011564657.2/,转载请声明来源钻瓜专利网。