[发明专利]用户流失的特征分析方法、预测方法、装置、设备及介质有效
申请号: | 201910018617.9 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109740685B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 肖源 | 申请(专利权)人: | 武汉斗鱼鱼乐网络科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 430000 湖北省武汉市东湖新技术开发区软件园东路*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 流失 特征 分析 方法 预测 装置 设备 介质 | ||
1.一种用户流失特征的分析方法,其特征在于,包括:
获取训练样本中已流失用户及未流失用户的用户信息,提取所述用户信息中的m个用户特征;
从所述m个用户特征任意选取n个用户特征,得到个特征组合,其中,n≥m/2;
针对上述个特征组合中的每个特征组合,计算所述特征组合中每个用户特征的决定性值,得到n个决定性值,并根据该n个决定性值将所述n个用户特征构造成二叉选择树模型;其中,所述计算所述特征组合中每个用户特征的决定性值,得到n个决定性值,包括:
针对于一个特征组合中的用户特征A,根据该用户特征A的k个不同取值将训练样本划分为k个不同的子集{s1,s2,s3,si,...sk};
统计每个子集中用户的数量,不同取值的用户特征A对应的流失用户的个数和未流失用户的数量;
通过计算用户特征A的决定性值,其中,TA为用户特征A的决定性值,|s|为训练样本的用户总数,|si|为第i个子集中用户的数量,sij为第i个子集中未流失用户的数量,siq为第i个子集中流失用户的数量,p0为所述训练样本中未流失用户出现的频率,p1为所述训练样本中流失用户出现的频率;
采用上述方法,计算其他用户特征的决定性值,得到所述n个决定性值;
将用户信息样本分别输入至个二叉选择树模型中,得到用户流失准确率排名靠前的X个二叉选择树模型;
对所述X个二叉选择树模型中的用户特征进行统计,得到数量排名靠前的Y个用户特征,作为用户流失特征。
2.根据权利要求1所述的方法,其特征在于,在所述二叉选择树模型中,决定性值最大的用户特征位于所述二叉选择树模型的最顶端节点,决定性值最小的用户特征位于所述二叉选择树模型的最底端节点,其他用户特征按照其决定性值从大到小的顺序,从上至下依次排列在所述最顶端节点与所述最底端节点之间的节点处。
3.根据权利要求1所述的方法,其特征在于,所述将用户信息样本分别输入至个二叉选择树模型中,得到用户流失准确率排名靠前的X个二叉选择树模型,包括:
针对于个二叉选择树模型中的每一个二叉选择树模型,将所述用户信息样本中每个用户的用户特征输入所述二叉选择树模型,输出对应用户是否流失的结果;
将输出的用户是否流失的结果与所述用户本身是否流失对比,分别统计每个二叉选择树模型输出的用户是否流失的结果与用户本身是否流失相同的用户的数量;
将所述用户的数量进行排名,得到所述准确率排名靠前的X个二叉选择树模型。
4.根据权利要求1所述的方法,其特征在于,所述m个用户特征包括:年龄、性别、是否结婚、是否有车、是否有孩子、工作年限、年收入、成为会员的天数、一定时间段的打赏消费、一定时间段的充值、关注的主播数、关注的主播在一定时间段的开播天数、一定时间段的弹幕数及是否流失中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼鱼乐网络科技有限公司,未经武汉斗鱼鱼乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910018617.9/1.html,转载请声明来源钻瓜专利网。