[发明专利]一种基于时间序列分解的商家客流量大数据预测方法有效
申请号: | 201711086963.8 | 申请日: | 2017-11-07 |
公开(公告)号: | CN107895283B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 王进;范磊;陈知良;周瑞港;胡峰;邓欣;李智星;雷大江;陈乔松 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时间 序列 分解 商家 客流量 数据 预测 方法 | ||
1.一种基于时间序列分解的商家客流量大数据预测方法,其特征在于,包括以下步骤:
101、对消费者和商家的历史消费数据进行预处理;
102、对经过预处理的数据构建特征工程,提取商家特征和用户支付行为特征,获取基本特征,并将基本特征按照特征对的方式两两匹配,形成组合特征,针对大量的组合特征,采用特征选择降维;
103、基于时间序列分解构建客流量预测模型;
104、对已建立模型进行多模型加权融合,预测商家客流量;
所述步骤101对历史消费数据进行预处理,包括以下步骤:
S1011、将历史数据分为训练集和测试集两部分,统计历史数据中商家信息的缺失值个数,并统计各个商家的缺失比例,对于缺失比例低于80%的商家,使用该商家对应曜日的均值填充;若缺失比例超过80%,如果近7个曜日有值,则只保留近7个曜日的值,否则将商家对应曜日的值全部清空;
S1012、对经过S1011处理的数据,通过数据可视化分析,将含有明显异常数据的那一周的数据全部剔除;
S1013、根据天气影响外出消费的程度由弱到强分别将描述天气的字段数值化,数值越大,外出消费意愿越小;
所述步骤102对经过预处理的数据构建特征工程,包括以下步骤:
S1021、根据历史数据提取商家特征和用户支付行为特征,并添加是否为节假日、周末、寒暑假期等影响消费的特征;
S1022、根据商家地理位置信息进行独热编码,针对由此造成的很高维的稀疏特征,进一步做特征选择——根据商家地理位置信息所属省份统计出每个省份拥有商家数并可视化出热力图;
S1023、选取前N1-1个省份,其他省份则合为“其他”,故共得到N1个省份分布;
S1024、将N1个省份中的商家计数并取log,再等值离散到若干个区间;
S1025、通过用户的支付时间反向估计商家的营业时间,根据商家各时段的客流量情况,将商家主要营业时间离散化,具体离散化为全部商家的主要营业时间以及每个商家的主要营业时间;
S1026、通过特征选择来降低特征维度,首先使用训练集训练Xgboost模型,在模型训练完成后输出特征重要性,保留top N2的特征,其中N2为特征总数的70%;
N1的取值优化过程为:分别取N1的值为3-10之间的数值,进行后续步骤,并将最后预测结果代入评价指标中,得到的Loss最小值所对应的N1值即为最佳N1值;
所述步骤103基于时间序列分解构建客流量预测模型,具体为:
S1031、根据历史数据,以日期为横轴、客流量为纵轴分析出客流量整体变化趋势;
S1032、从客流量整体变化趋势中分解出每周客流量的变化趋势;
S1033、分析每周内每天客流量的变化趋势占本周客流量整体变化趋势的占比;
S1034、分析给定时间段内每周内每个曜日的整体变化趋势;
S1035、根据历史数据,计算每周的客流量周均值,每周内每个曜日客流量的值除以周均值,得到一个比例值,然后按照曜日取比例值的均值和中位数,将均值和中位数分别分配不同权重,通过权重相加计算出周期因子;
S1036、将每个商家历史数据中每个曜日的比例值减去周期因子,作为残差标签;
S1037、将每个商家每个曜日的特征作为样本,给定历史数据的残差标签作为标签,使用Xgboost模型、RF模型、ET模型进行训练,分别得到学习模型;
S1038、对测试集使用学习模型得到预测结果,加上对应的周期因子,再将比例值乘以base值,base值表示去周期客流量均值,得到该商户某个曜日的客流量;
所述步骤S1038的base值的选取和优化策略为:去掉周期性因素后再取平均值,用客流量除以周期因子得到每个曜日的去周期客流量,选取距离预测时间最近的一段时间内的去周期客流量均值作为base。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711086963.8/1.html,转载请声明来源钻瓜专利网。