[发明专利]基于epsilon反馈算法的推荐系统冷启动方法有效
申请号: | 201710034167.3 | 申请日: | 2017-01-18 |
公开(公告)号: | CN106897912B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 蒋浩;朱登明;张洋 | 申请(专利权)人: | 太仓中科信息技术研究院 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N3/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 215400 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 epsilon 反馈 算法 推荐 系统 冷启动 方法 | ||
1.基于epsilon反馈算法的推荐系统冷启动方法,其特征在于,将免疫反馈模型引入Epsilon-greedy算法,利用免疫反馈模型动态调整epsilon值,具体包括如下步骤:
步骤1:将所有的物品当前用户的点击情况初始化为0,即让每个要推荐给用户的物品没有先验知识;
步骤2:根据用户点击推荐物品的结果更新epsilon值,并根据更新的epsilon值选择物品推荐给用户,具体步骤如下:
2.1)记录每次为用户推荐的物品、用户是否点击了此物品以及此物品被点击的次数,如果用户点击了算法推荐的物品返回1,如果用户没有点击算法推荐的物品则返回0,计算第t次为用户推荐之前用户点击推荐物品的平均次数reward(t)以及第t-d次为用户推荐之前用户点击推荐物品的平均次数reward(t-d),reward(t)的计算公式如下:
reward(t)=click(t)/recommended(t)
公式中,click(t)为用户在t时刻前对推荐物品的点击总量,recommended(t)为在t时刻前为用户推荐物品的总数;
2.2)根据reward(t)和reward(t-d)的差值Δreward计算为用户推荐时epsilon-greedy中的epsilon值,公式如下:
epsilon(t)=Kp[1-γ{epsilon(t-d)-epsilon(t-d-1)}2]Δreward
epsilon(t)为第t次为用户推荐时的epsilon值,epsilon(t-d)、epsilon(t-d-1)为第t-d次以及第t-d-1次为用户推荐时的epsilon值,参数Kp控制免疫系统对抗原的反应速度,参数γ控制免疫系统的稳定;
2.3)生成一个0-1之间的随机值,如果随机值大于步骤2.2得到的epsilon值,在所有的物品中随机的选择一个物品推荐给用户,如果生成的随机值小于步骤2.2得到的epsilon值,选择记录的被点击次数最高的物品推荐给用户。
2.根据权利要求1所述的基于epsilon反馈算法的推荐系统冷启动方法,其特征在于,所述参数d取值为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太仓中科信息技术研究院,未经太仓中科信息技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710034167.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于用户和物品的自适应个性化推荐方法
- 下一篇:一种精确的注塑机选型方法