[发明专利]一种去除周期性因素流失用户的预测方法及系统有效
申请号: | 201811578599.1 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109408582B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 李娟;房鹏展 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06Q10/04 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 去除 周期性 因素 流失 用户 预测 方法 系统 | ||
1.一种去除周期性因素流失用户的预测方法,其特征在于,包括如下步骤:
步骤一:整理用户所有关键行为表数据;所述关键行为表数据包括日期维表DIM_C和用户维表DIM_USER,所述日期维表DIM_C包含从产品发布日期至今的所有日期;所述用户维表DIM_USER包含从产品发布日期至今的所有用户的添加时间、年龄、性别、地址、联系方式的数据信息;
步骤二:对用户访问间隔及末次访问时间cal_last_visit进行计算,对用户所有关键行为表数据中的访问时间进行排序,将用户所有关键行为表数据中的访问时间选取出来,并将访问时间排序,增加一个排序标签ro,以用户user_id、访问时间cal_visit、ro字段存储在表1,表1的user_id与自身的user_id关联,表1的ro+1与自身的ro关联,找出每次访问后的下次访问时间及访问时间间隔,以用户user_id、访问时间cal_number、下次访问时间cal_number_next、访问间隔return_visit_days字段存入一张表A;表A的user_id与自身的user_id关联,限制第一张表A的访问间隔return_visit_days不为空,第二张表A的访问间隔return_visit_days为空,取出第二张表A的访问时间cal_number即用户的末次访问时间cal_last_visit,最后以用户user_id、访问时间cal_number、下次访问时间cal_number_next、访问间隔return_visit_days、末次访问时间cal_last_visit存入表B;
步骤三:分析用户的周期性,找出用户具有周期性非主观不使用产品的时间段;将用户user_id、非主观不使用开始时间nouse_cal_start、非主观不使用结束时间nouse_cal_end、非主观不使用时间间隔nouse_days存储在表C;表B的user_id与表C的user_id关联,表B的cal_number≤表C的nouse_cal_start、表B的cal_number_next≥表C的nouse_cal_end,取出表C字段非主观不使用时间间隔nouse_days,并运用聚合函数sum(b.nouse_days)over(partition by a.user_id,a.cal_number,a.cal_number_next)计算出每次访问间隔return_visit_days中非主观不使用天数,访问间隔return_visit_days减去非主观不使用天数,从而计算出实际访问间隔return_visit_days_real,以user_id、cal_number、cal_number_next、cal_last_vist、return_visit_days_real存入表D;
步骤四:使用拐点法计算流失期限;首先定义一段固定时长为流失期限lost_period,用户访问后若超过流失期限没再访问,所述流失期限去除非主观不使用天数,则为流失用户,若用户回访,则为流失用户中的回访用户,即回访率=流失用户中的回访用户/流失用户;从表D中取出每个用户的访问天数,如果用户仅访问过一次,则判断访问时间距离当前时间是否已超过流失期限,如果超过流失期限则回访标识return_flag=0,如果用户访问过多次,则判断表D中该用户回访时长有无超过流失期限,超过流失期限则回访标识return_flag=1,最终以用户user_id、流失期限lost_period、回访标识return_flag存入表E,以流失期限lost_period为横坐标,回访率作为纵坐标描点,迭代累加流失期限,绘制出曲线图,圈出拐点作为流失期限;
步骤五:判断并标识流失用户;关联日期维表DIM_C与用户维表DIM_USER,以访问时间cal_number≥会员添加时间addtime,得到会员明细表F,所述会员明细表F用于表示截止到每天的会员,表F与表D以user_id关联,取出表C的用户末次访问时间cal_last_vist,判断用户当前距离末次访问时间去除非主观不使用产品的时间间隔后是否大于等于流失期限,如若成立,则标识该用户为流失用户;
步骤六:将用户的具体信息推送给运营人员。
2.如权利要求1所述的一种去除周期性因素流失用户的预测方法,其特征在于:所述步骤一中,日期维表DIM_C粒度最细到天。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811578599.1/1.html,转载请声明来源钻瓜专利网。