[发明专利]一种针对单类协同过滤问题的负样本选择方法有效
申请号: | 201710285697.5 | 申请日: | 2017-04-27 |
公开(公告)号: | CN107423335B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 刘梦娟;马小栓;薛浩 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种针对单类协同过滤问题的负样本选择方法,目的是为基于机器学习模型的推荐算法中,针对没有明确负样本的隐式反馈场景,帮助选择每个用户的负样本。具体步骤如下:(1)基于物品流行度计算物品被选择为负样本的权重;(2)基于用户的社交关系计算物品被选择为负样本的权重;(3)基于用户对物品特征的偏好计算物品被选择为负样本的权重;(4)融合物品的流行度权重、社交关系权重、物品特征权重,计算物品被选择为目标用户的负样本的概率;(5)根据该用户的正样本数,按照一定比例选择负样本概率最高的若干物品作为目标用户的负样本。 | ||
搜索关键词: | 一种 针对 协同 过滤 问题 样本 选择 方法 | ||
【主权项】:
一种针对单类协同过滤问题的负样本选择方法,其特征在于,包括以下步骤:步骤1:针对每个用户u,计算该用户没有行为的物品被选择作为该用户负样本的流行度权重步骤2:根据每个用户的社交关系,计算考虑社交关系影响下,用户没有行为的物品被选择作为该用户负样本的权重ws(u,i);步骤3:基于物品的特征和用户u的历史行为,利用逻辑回归模型计算用户u没有行为的物品被选择作为用户u负样本的物品特征偏好权重wf(u,i);步骤4:融合物品流行度、社交关系、物品特征偏好三个权重,计算用户u选择物品i作为负样本的概率,如公式(1)所示,其中是参考物品流行度的权重,η1是物品流行度权重对该物品被选择为用户u的负样本的影响力因子,η1的范围为[0,1];ws(u,i)是参考用户u的社交关系的权重,η2是社交关系权重对该物品被选择为用户u的负样本的影响力因子,η2的范围为[0,1];wf(u,i)是参考用户对物品特征偏好的权重,η3是用户对物品特征偏好权重对该物品被选择为用户u的负样本的影响力因子,η3的范围为[0,1];三个影响力因子必须满足η1+η2+η3=1;w(u,i)=η1·wpnorm(i)+η2·ws(u,i)+η3·wf(u,i)---(1)]]>步骤5:对每个用户u,将用户u没有行为的物品根据计算得到的负样本概率值降序排列,按照与正样本数的一个比例关系,选择若干概率值最高的物品作为负样本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710285697.5/,转载请声明来源钻瓜专利网。