[发明专利]一种访客流失预测方法及系统在审
申请号: | 201810550089.7 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108830645A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 林志伟;肖龙源;蔡振华;李稀敏;刘晓葳;谭玉坤 | 申请(专利权)人: | 厦门快商通信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361007 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 访客 访客行为 训练集 惩罚参数 目标特征 输出预测 输入特征 测试集 数据集 预测 交叉验证 评估结果 预测模型 概率 算法 预设 评估 | ||
1.一种访客流失预测方法,其特征在于,包括以下步骤:
a.确定目标特征和输入特征,其中,所述输入特征为访客行为数据,所述目标特征为访客流失概率;
b.按照预设比例对所述访客行为数据划分数据集,所述数据集包括测试集和训练集;
c.对所述训练集采用交叉验证方法计算lasso算法中的惩罚参数λ;
d.根据所述惩罚参数λ利用所述训练集训练lasso-logit模型;
e.利用所述测试集对所述lasso-logit模型进行评估;
f.根据评估结果输出预测模型,将访客行为数据输入所述预测模型,并输出预测得到的访客流失概率。
2.根据权利要求1所述的一种访客流失预测方法,其特征在于:所述的步骤a中,所述访客行为数据包括以下任一种或者两种以上的组合:访问行为数据、购票行为数据、乘机行为数据。
3.根据权利要求1所述的一种访客流失预测方法,其特征在于:所述的步骤a中,所述访客行为数据包括以下任一种或者两种以上的组合:最后一次访问时间距观测窗口结束时间天数、最后一次购票时间距观测窗口结束时间天数、观测窗口内访问次数、观测窗口内成功购票次数、观测窗口会话总时长、观测窗口内消费金额、机票查询访问次数、航班选择访问次数、旅客信息访问次数、机票查询总停留时间、航班选择总停留时间、旅客信息总停留、时间付费搜索次数、非付费搜索次数、非会员手机登陆次数、会员登陆次数、会员日访问次数、PC端访问次数、移动端访问次数、访问间隔时间、支付订单访问次数。
4.根据权利要求1所述的一种访客流失预测方法,其特征在于:所述的步骤b中,所述数据集划分的预设比例为:训练集>测试集。
5.根据权利要求4所述的一种访客流失预测方法,其特征在于:所述数据集划分的预设比例为:训练集:测试集=4:1;或者,训练集:测试集=3:1。
6.根据权利要求1所述的一种访客流失预测方法,其特征在于:所述的步骤c中,对所述训练集采用交叉验证方法计算lasso算法中的惩罚参数λ,是指将所述训练集分成k份,遍历所述惩罚参数λ的取值范围,将其中k-1份组成的数据重新用于训练所述lasso-logit模型,剩余1份用于评估在此λ值下的所述lasso-logit模型的预测效果,得到所述lasso-logit模型的预测效果最好时的λ值;所述的步骤d中,根据该λ值进行训练所述lasso-logit模型。
7.根据权利要求1至6任一项所述的一种访客流失预测方法,其特征在于:所述的步骤b中,划分数据集之前,先对所述访客行为数据进行预处理,所述预处理包括:
b1.对所述访客行为数据进行数据筛查,剔除异常数据;所述异常数据包括数据异常和/或逻辑异常的数据;
b2.对所述访客行为数据中出现的缺失数据进行插补;
b3.对所述访客行为数据进行标准化处理,得到标准化后的访客行为数据。
8.根据权利要求1至6任一项所述的一种访客流失预测方法,其特征在于:所述的步骤b中,划分数据集之后,进一步对所述训练集进行平衡数据处理:如果所述训练集不平衡,则对所述训练集的数据进行欠抽样,从多数类样本中抽取少数类样本等量的样本数,并与少数类样本进行合成,得到平衡的训练集。
9.一种访客流失预测系统,其特征在于,包括:
特征确定模块,用于确定目标特征和输入特征,其中,所述输入特征为访客行为数据,所述目标特征为访客流失概率;
数据处理模块,其按照预设比例对所述访客行为数据划分数据集,所述数据集包括测试集和训练集;
参数优化模块,用于对所述训练集采用交叉验证方法计算lasso算法中的惩罚参数λ;
模型训练模块,其根据所述惩罚参数λ利用所述训练集训练lasso-logit模型;
模型评估模块,利用所述测试集对所述lasso-logit模型进行评估;
预测模块,其根据评估结果输出预测模型,将访客行为数据输入所述预测模型,并输出预测得到的访客流失概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通信息技术有限公司,未经厦门快商通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810550089.7/1.html,转载请声明来源钻瓜专利网。