[发明专利]基于人工智能的留存预测方法、装置、计算机设备及介质在审
申请号: | 202010898938.5 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112036641A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 张巧丽;林荣吉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/10;G06N20/10 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 何春兰;迟珊珊 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 留存 预测 方法 装置 计算机 设备 介质 | ||
1.一种基于人工智能的留存预测方法,其特征在于,所述方法包括:
对全量样本进行分箱处理得到多个分箱特征值;
从所述全量样本中选取多个批样本,并根据所述多个分箱特征值计算每个批样本的布尔矩阵;
初始化树模型,并采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量;
采用第二遗忘机制基于所述当前批样本的样本标识向量及对应的布尔矩阵计算所述当前批样本的信息增益矩阵;
根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值;
基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型;
使用所述留存预测模型基于待测用户的样本数据进行预测得到所述待测用户的留存时长。
2.如权利要求1所述的基于人工智能的留存预测方法,其特征在于,所述采用第一遗忘机制基于当前批样本的样本标识向量更新所述树模型中节点的样本统计量包括:
判断所述节点是否为根节点;
当所述节点为根节点,设置所述当前批样本的样本标识向量为第一标识向量,其中,所述第一标识向量中的元素值均为1;
当所述节点不为根节点时,设置所述当前批样本的样本标识向量为第二标识向量,其中,所述第二标识向量中的元素值包括0和1,1代表所述样本由所述根节点分配给所述节点,0代表所述样本由所述根节点分配给其他节点;
确定所述当前批样本之前的每一个批样本相对于所述当前批样本的相对批次,根据所述相对批次与预设第一系数计算所述批次对应的批样本的统计量的第一乘积;
根据所述当前批样本的统计量与所述当前批样本之前的每一个批样本对应的第一乘积更新所述当前批样本的统计量。
3.如权利要求1所述的基于人工智能的留存预测方法,其特征在于,所述根据所述多个分箱特征值计算每个批样本的布尔矩阵包括:
对于任意一个批样本,采用预设计算模型计算所述任意一个批样本中的每个样本与每个分箱特征值的第一布尔矩阵;
将每个样本对应的多个第一布尔矩阵进行连接得到第二布尔矩阵,作为所述样本的布尔矩阵;
将所述任意一个批样本对应的多个第二布尔矩阵进行连接得到第三布尔矩阵,作为所述任意一个批样本的布尔矩阵。
4.如权利要求3所述的基于人工智能的留存预测方法,其特征在于,所述预设计算模型为:其中,X为样本的特征值,A为分箱特征值,T为样本在该特征值下的最小特征值,为向下取整函数。
5.如权利要求1所述的基于人工智能的留存预测方法,其特征在于,在根据所述当前批样本的信息增益矩阵更新当前最优特征及所述当前最优特征的特征值之前,所述方法还包括:
获取与所述当前最优特征对应的历史最优特征;
获取所述历史最优特征的特征值;
计算所述当前最优特征的特征值与所述历史最优特征的特征值之间的信息增益差值;
判断信息增益差值是否小于预设差值阈值;
当所述信息增益差值小于所述预设差值阈值时,将所述历史最优特征作为所述当前最优特征,所述历史最优特征的特征值作为所述当前最优特征的特征值。
6.如权利要求1至5中任意一项所述的基于人工智能的留存预测方法,其特征在于,所述对全量样本进行分箱处理得到多个分箱特征值包括:
采用预设分箱数对全量样本进行分箱处理得到多个分裂点;
将所述多个分裂点作为多个分箱特征值。
7.如权利要求1至5中任意一项所述的基于人工智能的留存预测方法,其特征在于,所述基于所述当前最优特征及所述当前最优特征的特征值迭代训练所述树模型得到留存预测模型包括:
获取所述树模型输出的预测值;
计算所述预测值与对应的样本的真实值之间的预测误差;
判断所述预测误差是否小于预设误差阈值;
当所述预测误差大于所述预设误差阈值时,从所述全量样本中重新选取多个批样本,并重新训练所述留存预测模型,直至所述预测误差小于预设误差阈值,停止训练所述留存预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010898938.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理