[发明专利]基于人工智能的留存预测方法、装置、计算机设备及介质在审
申请号: | 202010898938.5 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112036641A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张巧丽;林荣吉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/10;G06N20/10 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 何春兰;迟珊珊 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 留存 预测 方法 装置 计算机 设备 介质 | ||
本发明涉及人工智能技术领域,提供一种基于人工智能的留存预测方法、装置、计算机设备及介质,包括:对全量样本进行分箱处理得到多个分箱特征值;从全量样本中选取多个批样本并根据多个分箱特征值计算每个批样本的布尔矩阵;初始化树模型并采用第一遗忘机制基于当前批样本的样本标识向量更新树模型中节点的样本统计量;采用第二遗忘机制基于当前批样本的样本标识向量及对应的布尔矩阵计算当前批样本的信息增益矩阵;根据当前批样本的信息增益矩阵更新当前最优特征及最优特征的特征值;基于当前最优特征及最优特征的特征值迭代训练树模型得到留存预测模型;使用留存预测模型预测待测用户的留存时长。本发明能够提高代理人留存预测的准确率。
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的留存预测方法、装置、计算机设备及介质。
背景技术
在互联网系统中,准代理人在入司前的一系列环节的表现(例如EPASS考试、AI面谈、新人体验、职岗培训)可以为预测该代理人入司后的留存考核提供很多有价值的预测特征。
树模型是天然的分类模型,具有可处理非线性特征、对数值型特征的数值大小不敏感、能处理缺省值问题、模型可解释性强等优点。
发明人在实现本发明的过程中发现,互联网系统中的数据的特征分布以及数据与目标变量的映射关系会随着时间发生迁移,而树模型不能实现在线更新学习,导致使用树模型在跨时间的留存预测场景中无法进行实时更新,因而将树模型应用在互联网系统中进行代理人留存预测时准确率较低。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的留存预测方法、装置、计算机设备及介质,能够提高代理人留存预测的准确率。
本发明的第一方面提供一种基于人工智能的留存预测方法,所述方法包括:
对全量样本进行分箱处理得到多个分箱特征值;
从所述全量样本中选取多个批样本,并根据所述多个分箱特征值计算每个批样本的布尔矩阵;
初始化树模型,并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量;
采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵;
根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值;
基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型;
使用所述留存预测模型基于待测用户的样本数据进行预测得到所述待测用户的留存时长。
根据本发明的一个可选的实施例,所述采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量包括:
判断所述节点是否为根节点;
当所述节点为根节点,设置所述当前批样本的样本标识向量为第一标识向量,其中,所述第一标识向量中的元素值均为1;
当所述节点不为根节点时,设置所述当前批样本的样本标识向量为第二标识向量,其中,所述第二标识向量中的元素值包括0和1,1代表所述样本由所述根节点分配给所述节点,0代表所述样本由所述根节点分配给其他节点;
确定所述当前批样本之前的每一个批样本相对于所述当前批样本的相对批次,根据所述相对批次与预设第一系数计算所述批次对应的批样本的统计量的第一乘积;
根据所述当前批样本的统计量与所述当前批样本之前的每一个批样本对应的第一乘积更新所述当前批样本的统计量。
根据本发明的一个可选的实施例,所述根据所述多个分箱特征值计算每个批样本的布尔矩阵包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010898938.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理