[发明专利]一种估计流失的方法、设备及计算机可读存储介质有效
申请号: | 202010125344.0 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111369044B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 刘志煌 | 申请(专利权)人: | 腾讯云计算(北京)有限责任公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/105;G06F16/2458;G06F18/23 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 估计 流失 方法 设备 计算机 可读 存储 介质 | ||
1.一种估计流失的方法,其特征在于,包括:
接收流失人员样本分析指令,并响应于所述流失人员样本分析指令,从流失人员样本库中提取出流失人员样本信息;
利用所述流失人员样本信息构造出流失人员样本序列,并对所述流失人员样本序列进行序列模式挖掘,得到频繁序列模式;所述频繁序列模式表征了所述流失人员样本信息所共同具备的特征,所述频繁序列模式是由所述流失人员样本序列所包含的序列子集组成;
根据所述频繁序列模式计算出所述流失人员样本序列对应的样本权重;
基于所述样本权重,对所述流失人员样本序列进行聚类,得到至少一个聚类中心位置;
当获取到待预测序列时,计算所述至少一个聚类中心位置与所述待预测序列的距离信息,进而得到所述待预测序列的流失概率,完成人员的流失估计。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述频繁序列模式计算出所述流失人员样本序列对应的样本权重之后,所述方法还包括:
当获取到所述待预测序列和非流失人员样本信息时,利用所述非流失人员样本信息构造出非流失人员样本序列;
基于所述样本权重,对所述待预测序列、所述流失人员样本序列和所述非流失人员样本序列进行聚类,得到至少一个聚类结果;
从所述至少一个聚类结果中挑选出所述待预测序列所属的目标聚类结果;
对所述目标聚类结果中的流失人员样本序列的数量进行占比计算,得到所述待预测序列的流失概率,完成人员的流失估计。
3.根据权利要求2所述的方法,其特征在于,所述对所述目标聚类结果中的流失人员样本序列的数量进行占比计算,得到所述待预测序列的流失概率,完成人员的流失估计,包括:
对所述目标聚类结果中的流失人员样本序列进行数量统计,得到统计结果;
利用所述统计结果与所述目标聚类结果中的人员样本序列的总数量相比,得到所述流失概率,从而完成人员的流失估计。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述流失人员样本信息中具有至少一个特征信息;所述利用所述流失人员样本信息构造出流失人员样本序列,包括:
对所述至少一个特征信息中的每个特征信息进行编码,得到编码结果;
利用所述编码结果组合得到所述流失人员样本序列。
5.根据权利要求4所述的方法,其特征在于,所述每个特征信息都有其所属的特征字段,每个特征字段对应了一个或多个特征信息;在所述对所述至少一个特征信息中的每个特征信息进行编码,得到编码结果之前,所述方法还包括:
从所述每个特征字段对应的所述一个或多个特征信息中,挑选出表征特征信息为空的空值特征信息,并统计出所述空值特征信息的数量;
将所述空值特征信息的数量大于等于预设特征过滤阈值的特征字段作为空值特征字段;
相应的,所述对所述至少一个特征信息中的每个特征信息进行编码,得到编码结果,包括:
对所述至少一个特征信息中除所述空值特征字段外的特征字段所对应的一个或个特征信息进行编码,得到所述编码结果。
6.根据权利要求5所述的方法,其特征在于,在所述从所述每个特征字段对应的所述一个或多个特征信息中,挑选出表征特征信息为空的空值特征信息,并统计出所述空值特征信息的数量之后,所述方法还包括:
将所述空值特征信息的数量小于预设特征过滤阈值的特征字段作为正常特征字段,从所述正常特征字段所对应的一个或多个特征信息中挑选出异常特征信息并删除,得到所述正常特征字段的中间特征信息;所述异常特征信息表征不符合特征信息的分布规律的特征信息;
利用所述中间特征信息构造出替代值;
利用所述替代值替换所述正常特征字段中的空值特征信息和异常特征信息,得到所述正常特征字段对应的优化后的特征信息;
相应的,所述对所述至少一个特征信息中的每个特征信息进行编码,得到所述每个特征信息的编码结果,包括:
对所述优化后的特征信息进行编码,得到所述编码结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(北京)有限责任公司,未经腾讯云计算(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010125344.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网络服务评分方法及装置
- 下一篇:一种基于深度学习的脑电图情感分类方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理