[发明专利]一种去除周期性因素流失用户的预测方法及系统有效
申请号: | 201811578599.1 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109408582B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 李娟;房鹏展 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06Q10/04 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种去除周期性因素流失用户的预测方法及系统,其特征在于,包括整理用户所有关键行为表数据;对用户访问间隔及末次访问时间进行计算,对用户所有关键行为表数据中的访问时间进行排序,将用户所有关键行为表数据中的访问时间选取出来,并将访问时间排序;分析用户的周期性,找出用户具有周期性非主观不使用产品的时间段;使用拐点法计算流失期限;判断并标识流失用户;将用户的具体信息推送给运营人员;该方法和系统能够更准确的找到流失用户,从而帮助企业分析及挽回流失用户。 | ||
搜索关键词: | 一种 去除 周期性 因素 流失 用户 预测 方法 系统 | ||
【主权项】:
1.一种去除周期性因素流失用户的预测方法,其特征在于,包括如下步骤:步骤一:整理用户所有关键行为表数据;所述关键行为表数据包括日期维表DIM_C和用户维表DIM_USER,所述日期维表DIM_C包含从产品发布日期至今的所有日期;所述用户维表DIM_USER包含从产品发布日期至今的所有用户的添加时间、年龄、性别、地址、联系方式等数据信息;步骤二:对用户访问间隔及末次访问时间(cal_last_visit)进行计算,对用户所有关键行为表数据中的访问时间进行排序,将用户所有关键行为表数据中的访问时间选取出来,并将访问时间排序,增加一个排序标签ro,以用户id(user_id),访问时间(cal_visit),ro字段存储在表1,表1与自身按user_id=user_id和ro+1=ro关联,找出每次访问后的下次访问时间及访问时间间隔,以用户id(user_id),访问时间(cal_number),下次访问时间(cal_number_next),访问间隔(return_visit_days)字段存入一张新表A;表A与自身按user_id=user_id关联,限制第一张表A的访问间隔(return_visit_days)不为空,第二张访问间隔(return_visit_days)为空,取出第二张表的访问时间(cal_number)即用户的末次访问时间(cal_last_visit),最后以用户id(user_id),访问时间(cal_number),下次访问时间(cal_number_next),访问间隔(return_visit_days),末次访问时间(cal_last_visit)存入表B;步骤三:分析用户的周期性,找出用户具有周期性非主观不使用产品的时间段;将用户id(user_id)、非主观不使用开始时间(nouse_cal_start)、非主观不使用结束时间(nouse_cal_end)、非主观不使用时间间隔(nouse_days)存储在新表C;表B及表C通过user_id=user_id,cal_number≤nouser_cal_start,cal_number_next≥nouse_cal_end关联,取出C表字段非主观不使用时间间隔(nouse_days)并运用聚合函数sum(b.nouse_days)over(partition by a.user_id,a.cal_number,a.cal_number_next)计算出每次访问间隔(return_visit_days)中非主观不使用天数,访问间隔(return_visit_days)减去非主观不使用天数,从而计算出实际访问间隔(return_visit_days_real),以user_id,cal_number,cal_number_next,cal_last_vist,return_visit_days_real存入表D。步骤四:使用拐点法计算流失期限;首先定义一段固定时长为流失期限(lost_period),用户访问后若超过流失期限没再访问,所述流失期限去除非主观不使用天数,则为流失用户,若用户回访,则为流失用户中的回访用户,即回访率=流失用户中的回访用户/流失用户;从表D中取出每个用户的访问天数,如果用户仅访问过一次,则判断访问时间距离当前时间是否已超过流失期限,如果超过流失期限则回访标识return_flag=0,如果用户访问过多次,则判断表D中该用户回访时长有无超过流失期限,超过流失期限则回访标识return_flag=1,最终以用户id(user_id),流失期限(lost_period),回访标识(return_flag)存入表E,以流失期限(lost_period)为横坐标,回访率(回访标识为1的用户数/用户数)作为纵坐标描点,迭代累加流失期限,绘制出曲线图,圈出拐点作为流失期限。步骤五:判断并标识流失用户;关联日期维表DIM_C与用户维表DIM_USER,以访问时间(cal_number)≥会员添加时间(addtime),得到会员明细表F,所述会员明细表F用于表示截止到每天的会员,表F与表D以user_id关联,取出C表的用户末次访问时间(cal_last_vist),判断用户当前距离末次访问时间去除非主观不使用产品的时间间隔后是否大于等于流失期限,如若成立,则标识该用户为流失用户;步骤六:将用户的具体信息推送给运营人员。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811578599.1/,转载请声明来源钻瓜专利网。