[发明专利]一种商品购买预测建模方法在审
申请号: | 201710464566.3 | 申请日: | 2017-06-19 |
公开(公告)号: | CN107392644A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 李拥军;邱双旭;林浩 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N99/00 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 许菲菲 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 商品 购买 预测 建模 方法 | ||
技术领域
本发明涉及一种机器学习建模的方法,特别是涉及一种商品购买预测建模方法,属于人工智能技术领域。
背景技术
预测是对过往行为数据进行挖掘,根据可靠的计算和演绎,对未来事件发展进行预估。时序预测的一般过程是先确定预测的归宿与目标,接着选取合适的预测周期和方法,然后收集在预测过程中可能会使用的数据资料,最后经过严谨的分析作出预测。
根据预测目标距今的远近,可以简单分为以下几种。短期预测一般为几小时或者几天内,近期预测为几周或者几个月,中期预测一般不超过5年,而长期预测一般在5年以上。随着预测时间变长,预测准确度会不断下降。
时序预测的方法有很多,目前使用较多的是移动平均数预测法和指数平滑预测法,下面对这两种分析方法进行介绍:
(1)移动平均数预测法的基本原理是利用平均数作为代表分析时间序列的变化趋势。首先确定步长,对原始时间序列进行分箱,然后用每个箱的均值求出趋势变化情况。最后利用均值的趋势对未来进行预测。模型的数学表达如下:
假设x1,x2,...,xl为一时间序列,一次移动的均值
其中i为时间节点,x1为时间节点i的数值,N为移动平均的次数。递推算法为
同样二次移动平均值递推算法为
移动平均预测法的模型为
Yl+τ=al+blT,T=1,2,...
其中αl和bl为平滑系数,具体的计算公式为
移动平均数预测法的特点是对随机性不敏感,预测时刻画长期的趋势变化。同样这种方法也会丢失一些周期规律,无法细致的把握局部变化情况。
(2)指数平滑预测法通过指数加权对移动平均进行改进。一次指数平滑值递推公式为其中α为[0,1]的加权系数。
指数平滑预测的速度快,方法简单,因此被广泛应用于短期时间序列的预测当中。
发明内容
本发明的目的是将时间序列预测与用户行为建模方法相结合,提出一种商品购买预测建模方法,将时间偏好的特征体系和滑动窗口样本构造方法有效结合,有效提升商品购买预测模型的准确性。
本发明目的通过如下技术方案实现:
一种商品购买预测建模方法,包括如下步骤:
1)用购买记录标记训练样本,预测购买与否,结果为1代表购买,为0则代表不购买;
2)滑动窗口商品购买样本构造;
3)基于时间偏好的商品购买特征设计;遵循时间偏好规则:近期频繁做某件事情,就越有可能在下次继续;通过User-Item特征、User特征、Item特征、Category特征、User-Category特征和Cross特征6大类特征描述用户对商品的购买行为;在6大类特征的基础上,从8个维度进行特征的提取;所述8个维度分别是计数、比值、Flag、排序、时间间隔、时间层级、规则和地理位置;
4)梯度提升决策树算法训练预测;构造好样本与特征之后,要进行特征处理与选取的工作,再输入到梯度提升决策树算法中进行训练预测;特征选取的指标包括特征值分布与相关性、特征信息增益大小、特征调用频率、特征敲除的影响等。综合这些指标对特征重要性进行排序,剔除重要度低的冗余特征。
优选地,所述用购买记录标记训练样本采用交叉验证法将数据样本切割成较小子集,分别在不同的子集上做训练与验证,进行优化。
优选地,所述滑动窗口商品购买样本构造是将时间轴分成两个部分,一部分刻画用户的历史行为,另一部分刻画类别标签,往时间节点前面滑动,充分利用历史信息,产生不同时间节点样本输入到模型,使模型鲁棒性更好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710464566.3/2.html,转载请声明来源钻瓜专利网。