[发明专利]一种确定用户流失率的方法、装置、设备及存储介质在审
申请号: | 202211717956.4 | 申请日: | 2022-12-29 |
公开(公告)号: | CN116258516A | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 刘小芳;李涛;王军博;李成其;姜霄;宋凯华 | 申请(专利权)人: | 中国石油化工股份有限公司;石化盈科信息技术有限责任公司 |
主分类号: | G06Q30/0202 | 分类号: | G06Q30/0202;G06N20/00;G06N5/01;G06F18/2431;G06F17/18 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 郑哲琦;吴昊 |
地址: | 100728 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 用户 流失率 方法 装置 设备 存储 介质 | ||
本申请公开了一种确定用户流失率的方法、装置、设备及存储介质,该方法包括:获取用户特征数据、逻辑回归模型和改进的随机森林模型;根据用户特征数据和逻辑回归模型确定用户稳定系数;根据用户特征数据、用户稳定系数和改进的随机森林模型确定用户流失率;其中,改进的随机森林模型包含有用户稳定系数。上述方案通过在现有的随机森林模型中引入用户稳定系数这一参数,对该模型进行改进,基于改进后的随机森林模型对用户流失率进行预测,使得用户流失率成为用户稳定性与流失性的线性结果,从而提高预测用户流失率的准确性。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种确定用户流失率的方法、装置、设备及存储介质。
背景技术
现有的预测客户流失率的方案是获取流失预测模型,基于该模型和客户的历史消费行为,对之后一段时间内客户流失率进行预测,但是该方法对于一些具有周期性特性的行业而言,预测精准度差,无法准确把握预计黄金期,容易造成客户流失率高。
发明内容
本申请实施例提供了一种确定用户流失率的方法、装置、设备及存储介质,通过在现有的随机森林模型中引入用户稳定系数这一参数,对该模型进行改进,基于改进后的随机森林模型对用户流失率进行预测,使得用户流失率成为用户稳定性与流失性的线性结果,从而提高预测用户流失率的准确性。
第一方面,本申请实施例还提供了一种确定用户流失率的方法,该方法包括:
获取用户特征数据、逻辑回归模型和改进的随机森林模型;
根据用户特征数据和逻辑回归模型确定用户稳定系数;
根据用户特征数据、用户稳定系数和改进的随机森林模型确定用户流失率;
其中,改进的随机森林模型包含有用户稳定系数。
可选地,在根据用户特征数据和逻辑回归模型确定用户稳定系数之前,本申请实施例还提供了一种方法包括:
对用户数据特征数据进行预处理;
预处理包括特征工程、异常数据处理和数据规整。
在一种示例中,上述根据用户特征数据和逻辑回归模型确定用户稳定系数,包括:
根据逻辑回归模型对用户特征数据进行训练,得到训练后的模型参数;
根据用户特征数据和训练后的模型参数确定用户稳定系数。
在一种示例中,上述根据用户特征数据和训练后的模型参数确定用户稳定系数,包括:
根据用户特征数据和训练后的模型参数,基于第一公式确定用户稳定系数;
其中,第一公式包括:
其中,β0、β1、β2、…、βd为训练后的模型参数,x1、x2、…、xd为用户特征数据。
在一种示例中,上述根据用户特征数据、用户稳定系数和改进的随机森林模型确定用户流失率,包括:
根据用户特征数据和改进的随机森林模型确定M个分类结果;
其中,M个分类结果与改进的随机森林模型包含的M个决策树一一对应,其中,M为大于0的整数;
根据用户稳定系数、M个分类结果和改进的随机森林模型确定用户流失率。
在一种示例中,根据用户特征数据和改进的随机森林模型确定M个分类结果,包括:
基于改进的随机森林模型包含的信息增益参量对用户特征数据进行评估,确定出可参考的用户特征数据;
根据可参考的用户特征数据和改进的随机森林模型确定分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油化工股份有限公司;石化盈科信息技术有限责任公司,未经中国石油化工股份有限公司;石化盈科信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211717956.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电梯井及小空间内支撑装置
- 下一篇:一种放射治疗系统