[发明专利]一种基于协同过滤与关联规则的服装推荐方法在审
申请号: | 202010474194.4 | 申请日: | 2020-05-29 |
公开(公告)号: | CN111815351A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 王一君;陈灿;毛嘉宇;吴珊珊 | 申请(专利权)人: | 杭州览众数据科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/9535;G06F16/9536 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310000 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 过滤 关联 规则 服装 推荐 方法 | ||
1.一种基于协同过滤与关联规则的服装推荐方法,其特征在于具体步骤如下:
步骤1:将历史数据按指定时间t0和指定时间长度Δt划分为训练数据train_set和测试数据test_set,其中,train_set为销售时间小于t0的所有销售数据,test_set表示销售时间为t0到t0+Δt内的所有销售数据;获取会员静态属性标签{Vi}i∈I以及产品的商品标签{Lq}q∈Q;
步骤2:将训练数据train_set按照指定时间长度Δt和会员划分,形成销售分布表{Di,k},其中Di,k表示会员i在[t0-(k+1)Δt,t0-kΔt]时间点段内的销售数据序列,为了方便叙述,后续统一记Δtk=[t0-(k+1)Δt,t0-kΔt];
步骤3:基于历史购物记录,计算指定时间段内会员购物记录之间的Jaccard相似度(购物记录相似度)矩阵其中表示会员i与会员j在时间段内的Jaccard相似度;
步骤4:根据销售分布表,对每个给定的会员i和指定的时间段使用会员在前的销售数据计算会员的RFM特征,将RFM特征与会员静态属性特征Vi拼接后并进行one-hot编码,由此得到会员i在时间段内的特征向量根据得到的特征向量计算会员属性之间的余弦相似度矩阵(会员属性相似度)其中表示会员i与会员j在时间段内的余弦相似度,所述的会员自身的静态属性标签包括年龄、职业、身高、体型、偏好、忌讳颜色,所述的会员RFM特征包括上一次购买间隔时长、月均购物频率、单笔购物记录平均价格和上一次购物的价格;
步骤5:基于会员在指定的时间段的销售数据得到指定时间段内的订单数据表其中表示指定的时间段内的第m个订单数据基于上述订单分布表通过Apriroi算法计算指定时间段内,商品标签频繁项集的个数n,以及n个频繁项集之间的支持度所述Lq表示订单中产品的商品标签,具体包含大类A、中类A、色系A、版型A、衣长A;
步骤6:对给定的会员i和指定时间段分别根据Jaccard相似度矩阵余弦相似度矩阵寻找与i最相似的两个会员(不包括已选择过的会员)的销售数据和再结合商品标签的关联度在和中选择与相关联的销售记录补充到会员i的历史购物记录中;
步骤7:重复步骤6直到会员i在指定时间段内的销售数据等于模型的输入阈值,增加的销售数据记为
步骤8:根据每一个会员在指定时间段前的所有真实购物记录与新增购物记录分别计算该会员对上装和下装的长期购物偏好,短期购物偏好以及季度购物偏好。所述长期购物偏好包括去年同季度会员对各商品标签的购买频率,去年相邻两个季度会员对各商品标签的购买频率;所述短期购物偏好包括前一个月会员对各商品标签的购买频率,前三个月会员对各商品标签的购买频率以及前六个月会员对各商品标签的购买频率等;所述季度购物偏好包括前会员分别对所有春,夏,秋和冬季各商品标签的购买频率;
步骤9:对于每一个会员i以及给定的时间段从数据库中载入会员i在时刻所到门店的历史库存信息,并借助此库存信息获取会员i在时间段内可以接触到的产品集合Q(i,k0);结合步骤3-8计算会员在时的购物偏好此时用f表示真实的购物概率函数,其中f(Vi,Pi,k,Lq)q∈Q(i,k)表示具有Vi特征和Pi,k偏好的会员i对具有Lq属性的产品的购买概率,若会员i在Δtk时刻买了产品q,则f(Vi,Pi,k,Lq)=1,反之为0。进一步采用DeepFM模型在训练集train_set中拟合函数f;
步骤10:通过DeepFM算法训练得到模型表示模型预测的会员i在Δtk时刻是对产品q的推荐度,在测试集test_set上测试得到相应的推荐度结果,评估推荐度的准确率,具体仿真环境以及准确率计算公式如下:
测试会员选择:在test_set中出现的所有会员;
测试产品选择:已知test_set表示销售时间为t0到t0+Δt内的所有销售数据,对每个给定的测试会员i,根据历史库存数据获取会员i可以接触的产品集Q(i,-1);
推荐结果:若会员没有在t0到t0+Δt时间段内购物,则模型不进行推荐;若会员在t0到t0+Δt时间段内有购物记录,则模型选择推荐度最高的两个产品作为推荐产品;
产品售罄率:模型推荐并且会员在t0到t0+Δt时间段购买过的产品数/模型推荐产品数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州览众数据科技有限公司,未经杭州览众数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010474194.4/1.html,转载请声明来源钻瓜专利网。