[发明专利]一种BPR中样本空间缩小方法及装置有效
申请号: | 201810961395.X | 申请日: | 2018-08-22 |
公开(公告)号: | CN110858374B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 金德鹏;丁璟韬;李勇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 bpr 样本 空间 缩小 方法 装置 | ||
本发明提供一种BPR中样本空间缩小方法及装置,所述方法包括:对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间。本发明缩小负样本空间,在保证推荐性能的基础上基于缩小的负样本空间进行商品推荐,提高了商品推荐的效率。
技术领域
本发明属于推荐系统技术领域,更具体地,涉及一种BPR中样本空间缩小方法及装置。
背景技术
个性化排序是指给用户提供商品列表以供用户选择,也称为商品推荐。典型的例子是电商希望给用户个性化地推荐该用户可能购买过的商品排序列表。而在大多数应用场景下,这样的排序列表只能通过用户与商品之间隐式的反馈行为进行推断,如购买属于隐式反馈,而对商品的评分则属于显式反馈。隐式反馈推荐系统的特点是仅能观察到的用户的正反馈行为,如购买商品,而未观察到的行为,即一个用户未购买某样商品,则由真正的负反馈和缺失值组成,其中负反馈为用户实际上没有兴趣购买过的商品,缺失值为用户可能有兴趣购买,只是没有发现的商品。
商品推荐系统通常的做法是用分数预测用户u对商品i的喜好程度,通过使预测值与真实值xui之间的误差最小化,得到最优的分数将商品按照预测分数的高低进行排序,得到推荐列表,这种做法称为逐点回归推荐算法。为了在隐反馈系统中采用逐点回归的算法,需要将观测到的正反馈行为标记为正样本,如赋值为1,未观测的行为均标记为负样本,如赋值为0。之后用最小化均方根误差的方法进行数据拟合。这种不区分未观测行为的做法有明显的缺陷,如果一个模型能非常好的拟合训练数据,那么所有未观测行为均被预测为0,无法得到商品的排序列表;此外,通常观测到的数据只占很少一部分,如果将所有未观测到的用户-商品交互都标记为负样本,则会对算法效率提出很高的要求。
贝叶斯个性化排序(Bayesian Personalized Ranking,简称BPR)模型是代表性的逐对排序推荐算法,为了避免逐元素算法不区分未观测行为的弊端,BPR优化的目标不再是单个的预测分数而是不同反馈行为之间的排序。BPR假定观测到的正样本的预测分数应当高于未观测的样本预测分数,其优化目标如下:
其中,u代表用户,i代表该用户有正反馈交互行为的商品,j代表同一用户的未观测行为对应的商品,D代表了所有满足条件的(u,i,j)构成的集合;代表两种行为预测分数之差,为sigmoid函数,将差值转化为概率值;λθ‖θ‖2一项用于防止过拟合,θ代表模型参数,λθ控制过拟合程度。上述优化目标等效于优化排序结果的AUC(Area under The ROC Curve,ROC曲线下面积)参数。ROC(Receiver OperatingCharacteristic,受试者工作特征)曲线又称为感受性曲线,在ROC曲线上各点反应这相同的感受性,它们都是对同一信号刺激的反应。
为了获得用户u对某一商品i的喜好程度可以采用矩阵分解或k近邻的方式。通常采用随机梯度下降方法进行优化,在每一次迭代中,随机选取观测到的交互行为(u,i),再从用户u没有交互的商品中选择j构成训练样本(u,i,j)。选取j的过程,称为负采样器,BPR的性能很大程度上取决于负采样器。传统的BPR算法中,采用从负样本空间中均匀采样的方式选择负样本j,这种采样方式非常低效,而且会减缓收敛速度,尤其在样本空间大的数据集上。动态负采样器旨在通过选择预测分数较大的负样本,即使得loss函数偏大的负样本,在每一次迭代中获得较大的梯度,相比传统的BPR算法有了明显的提升,但是,这种采样方式仍然基于整个负样本空间,在样本数量较大时仍然十分低效。
发明内容
为克服上述现有的BPR模型基于整个负样本空间导致负样本的采样和商品推荐低效的问题或者至少部分地解决上述问题,本发明提供一种BPR中样本空间缩小方法及装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810961395.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务运行方法、装置、存储介质及电子装置
- 下一篇:一种打磨装置