[发明专利]一种基于用户偏好的自适应采样方法有效
申请号: | 201610041393.X | 申请日: | 2016-01-22 |
公开(公告)号: | CN105740327B | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 谭铁牛;王亮;吴书;郭韦昱 | 申请(专利权)人: | 天津中科智能识别产业技术研究院有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06K9/62 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300465 天津市滨海新区天津经济技*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 偏好 自适应 采样 方法 | ||
1.一种基于用户偏好的自适应采样方法,其特征在于,包括步骤:
S1,以特征学习的方法从用户和商品的属性特征中学习到用户和商品的低秩表达U0和V0,作为BPR模型的初始参数;
S2,根据商品的低秩表达在不同特征维度下对商品进行从大到小排序,得到k个特征维度下的商品排序列表L1,L2,...,Lk;
S3,根据商品和用户的低秩特征表达向量,计算训练集合中每一用户购买商品记录(ui,vp)从属于各特征维度的概率分布p(d|ui,vP),并以0初始化一与低秩特征维数相等长度的计数器数组counts;
S4,根据概率分布p(d|ui,vp)从低秩特征向量的维度中采样出一特征维度dz作为相关购买记录从属的特征维度;
S5,利用几何分布在商品集合排序空间中以预设概率p(r)采样出一排序序号r;
S6,结合特征维度dz和排序序号r在商品排序列表中取得一商品作为一个可与用户已经购买的商品vp进行比较且当前用户未曾购买的商品vq,如果采样得到的商品是用户ui购买过的商品,重新执行S5-S6,直到得到的商品是用户ui没有购买过的商品vq组成一个三元组(ui,vp,vq),并让计数器加1;然后重复构建一个三元组集合Ds;
S7,用三元组集合Ds训练一轮BPR模型,得到商品和用户的低秩表达矩阵V1∈Rm×k,U1∈Rn×k,并以U1更新U0;
S8,根据计数器数组counts值计算各特征维度的热门程度,并根据热门程度采样一个特征维度dh,计算V1的第dh列和V0的第dh列的相应向量的相似度若sim≤ρ,0<ρ<1,则以V1的第dh列更新V0的第dh列,并重新对商品根据特征维度dh特征值大小进行排序,更新排序列表
S9,执行S3~S8,直到U1和V1收敛。
2.根据权利要求1所述基于用户偏好的自适应采样方法,其特征在于,所述概率分布p(d|ui,vp)通过下式获得:
其中,和分别表示U0和V0的列平均值,和则表示U0和V0的列方差。
3.根据权利要求1所述基于用户偏好的自适应采样方法,其特征在于,所述预设概率p(r)∝exp(-r/ω),ω是一个先验参数,用以控制分布的概率密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津中科智能识别产业技术研究院有限公司,未经天津中科智能识别产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610041393.X/1.html,转载请声明来源钻瓜专利网。