[发明专利]一种基于用户偏好的自适应采样方法有效
申请号: | 201610041393.X | 申请日: | 2016-01-22 |
公开(公告)号: | CN105740327B | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 谭铁牛;王亮;吴书;郭韦昱 | 申请(专利权)人: | 天津中科智能识别产业技术研究院有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06K9/62 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300465 天津市滨海新区天津经济技*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于用户偏好的自适应采样方法。该方法根据用户购买记录中反映的用户偏好及BPR模型的特性,自适应的构建三元组训练数据,训练BPR模型。与传统的基于随机采样的训练方法相比,本发明所设计的自适应采用算法,可以加速传统BPR模型的训练收敛,而且根据实际训练过程中,每一轮模型训练中个体模型参数数值变化不大,不足以引起商品排序上的剧烈变化这一实际观察现象,本发明专门设计了减少三元组训练实例构建开销的策略,从而以比传统随机采样增加很小一部分开销为代价,在保证模型预测精确度不下降的同时,极大的加速BPR模型训练的收敛。 | ||
搜索关键词: | 一种 基于 用户 偏好 自适应 采样 方法 | ||
【主权项】:
1.一种基于用户偏好的自适应采样方法,其特征在于,包括步骤:S1,以特征学习的方法从用户和商品的属性特征中学习到用户和商品的低秩表达U0和V0,作为BPR模型的初始参数;S2,根据商品的低秩表达在不同特征维度下对商品进行从大到小排序,得到k个特征维度下的商品排序列表L1,L2,...,Lk;S3,根据商品和用户的低秩特征表达向量,计算训练集合中每一用户购买商品记录(ui,vp)从属于各特征维度的概率分布p(d|ui,vP),并以0初始化一与低秩特征维数相等长度的计数器数组counts;S4,根据概率分布p(d|ui,vp)从低秩特征向量的维度中采样出一特征维度dz作为相关购买记录从属的特征维度;S5,利用几何分布在商品集合排序空间中以预设概率p(r)采样出一排序序号r;S6,结合特征维度dz和排序序号r在商品排序列表中取得一商品作为一个可与用户已经购买的商品vp进行比较且当前用户未曾购买的商品vq,如果采样得到的商品是用户ui购买过的商品,重新执行S5‑S6,直到得到的商品是用户ui没有购买过的商品vq组成一个三元组(ui,vp,vq),并让计数器加1;然后重复构建一个三元组集合Ds;S7,用三元组集合Ds训练一轮BPR模型,得到商品和用户的低秩表达矩阵V1∈Rm×k,U1∈Rn×k,并以U1更新U0;S8,根据计数器数组counts值计算各特征维度的热门程度,并根据热门程度采样一个特征维度dh,计算V1的第dh列和V0的第dh列的相应向量的相似度若sim≤ρ,0<ρ<1,则以V1的第dh列更新V0的第dh列,并重新对商品根据特征维度dh特征值大小进行排序,更新排序列表S9,执行S3~S8,直到U1和V1收敛。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津中科智能识别产业技术研究院有限公司,未经天津中科智能识别产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610041393.X/,转载请声明来源钻瓜专利网。