[发明专利]一种BPR中样本空间缩小方法及装置有效
申请号: | 201810961395.X | 申请日: | 2018-08-22 |
公开(公告)号: | CN110858374B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 金德鹏;丁璟韬;李勇 | 申请(专利权)人: | 清华大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 bpr 样本 空间 缩小 方法 装置 | ||
1.一种BPR中样本空间缩小方法,其特征在于,包括:
对于目标购物系统中的任一用户,根据该用户购买过的商品获取该用户对应的负采样比例系数,将所述目标购物系统的商品全集中除该用户购买过的商品以外的商品作为负样本候选集;所述负采样比例系数为从所述负样本候选集中选取商品的比例,通过该用户购买过的商品获取;
根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间;
其中,所述根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤具体包括:
使用该用户对应的负采样比例系数乘以该用户对应的负样本候选集中的商品个数,获取抽取个数;
根据所述抽取个数,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间;
根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之前还包括:
根据所述负样本候选集中各商品的购买数量,获取所述负样本候选集中各商品的流行程度;
根据所述负样本候选集中各商品的流行程度,确定所述负样本候选集中各商品的抽取概率;
相应地,根据所述抽取个数,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间的步骤还包括:
根据所述抽取个数和所述负样本候选集中各商品的抽取概率,从所述负样本候选集中抽取商品,将抽取的商品作为该用户对应的负样本空间。
2.根据权利要求1所述的方法,其特征在于,通过以下公式根据该用户购买过的商品获取该用户对应的负采样比例系数:
其中,αu为负采样比例系数,c为第一预设常数,|Su|为该用户购买过的商品数量。
3.根据权利要求1所述的方法,其特征在于,根据所述负样本候选集中各商品的购买数量,获取所述负样本候选集中各商品的流行程度的步骤具体包括:
将所述负样本候选集中各商品的购买数量与多个预设范围进行比较,获取所述负样本候选集中各商品的购买数量所落入的预设范围;
根据各所述所落入的预设范围,获取各所述所落入的预设范围对应的流行程度;其中,所述所落入的预设范围与所述流行程度预先关联存储;
相应地,根据所述负样本候选集中各商品的流行程度,确定所述负样本候选集中各商品的抽取概率的步骤具体包括:
根据各所述流行程度,获取各所述流行程度对应的预设概率;其中,所述流行程度与所述预设概率预先关联存储;
根据各所述流行程度对应的预设概率,确定所述负样本候选集中各商品的抽取概率。
4.根据权利要求3所述的方法,其特征在于,通过以下公式根据各所述流行程度对应的预设概率,确定所述负样本候选集中各商品的抽取概率:
其中,Pnsi为所述负样本候选集中第i个商品nsi的抽取概率,为所述负样本候选集中第i个商品nsi的流行程度对应的预设概率,为所述负样本候选集中第k个商品nsk的流行程度对应的预设概率,N为所述负样本候选集中商品的总个数,a为第二预设常数。
5.根据权利要求1-4任一所述的方法,其特征在于,根据该用户对应的负采样比例系数和负样本候选集,获取该用户对应的负样本空间的步骤之后还包括:
从预先获取的该用户的购买记录集合中随机选取购买记录,从该用户对应的负样本空间中随机选取商品;其中,各购买记录包括该用户和该用户购买过的任一商品;
根据从该用户的购买记录集合中随机选取的购买记录和从该用户对应的负样本空间中随机选取的商品,构建该用户对应的训练样本;
根据该用户对应的训练样本,对BPR模型中的参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810961395.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:业务运行方法、装置、存储介质及电子装置
- 下一篇:一种打磨装置