[发明专利]模型生成、识别客户购买车险意向的方法及系统有效
申请号: | 201810450784.6 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108648011B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 吕兴;杨治;张伟 | 申请(专利权)人: | 上海赢科信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;邓忠红 |
地址: | 200042 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 识别 客户 购买 车险 意向 方法 系统 | ||
1.一种模型生成的方法,其特征在于,包括以下步骤:
获取每个客户的历史数据,每条所述历史数据包括所述客户的客户信息和/或所述客户已经发生的车险数据和/或所述客户的车辆数据和/或所述客户的车辆的经销商数据,所述经销商数据为所述客户购买车辆的经销商的数据;
通过所述客户的识别信息对所述历史数据进行预处理,以得到与每个所述客户一一对应的第一历史序列,所述第一历史序列包括以下字段:所述客户的客户信息、所述客户已经发生的车险数据、所述客户的车辆数据以及所述客户的车辆的经销商数据;
对所述历史数据中的所有所述经销商的数据进行聚类分析,以得到每个所述经销商的类别标签;
对所述第一历史序列中所述经销商进行标注以得到第二历史序列,所述第二历史序列包括所述第一历史序列的信息和所述第一历史序列中所述经销商的类别标签;
对每条所述第二历史序列进行目标变量的标注以得到第三历史序列,所述目标变量表示所述第二历史序列中所述经销商历史销售车险是否成功的结果,所述第三历史序列包括所述第二历史序列的信息和对应的所述目标变量的值;
对所述第三历史序列进行特征筛选,以得到第四历史序列,每条所述第四历史序列中包括符合预期相关度的若干特征;
使用二分类算法利用所述第四历史序列进行模型训练,以生成预测模型。
2.如权利要求1所述的模型生成的方法,其特征在于,所述识别信息包括所述客户的身份证号和/或车架号。
3.如权利要求1所述的模型生成的方法,其特征在于,对所述历史数据中的所有所述经销商的数据采用Kmeans算法进行聚类分析。
4.如权利要求1所述的模型生成的方法,其特征在于,所述二分类算法为GBDT或随机森林或支持向量机或逻辑回归。
5.如权利要求4所述的模型生成的方法,其特征在于,当所述二分类算法为GBDT时模型训练优化的参数包括最大迭代次数、权重缩减系数和决策树最大深度;所述最大迭代次数的取值范围为20~100;所述权重缩减系数的取值范围为0.01~0.1;所述决策树最大深度的取值范围为10~100。
6.如权利要求1所述的模型生成的方法,其特征在于,
所述客户信息包括以下数据中的至少一种:所述客户的性别、年龄、是否贷款购车以及续保年限;
所述客户已经发生的车险数据包括保险数据和理赔数据;
所述客户的车辆数据包括以下数据中的至少一种:车型、年款、车价、排气量和发动机类型;
所述客户的车辆的经销商数据包括经销商客户服务数据和经销商自身的数据。
7.如权利要求2所述的模型生成的方法,其特征在于,通过所述客户的识别信息对所述历史数据进行预处理,包括:
通过所述客户的身份证号和/或车架号对所述历史数据进行交叉整合、清洗及转换,所述清洗用于处理离群值和异常值,所述转换用于对所述历史数据进行离散化和标准化。
8.如权利要求1所述的模型生成的方法,其特征在于,利用卡方值检验法对所述第三历史序列进行特征筛选。
9.一种识别客户购买车险意向的方法,其特征在于,包括以下步骤:
执行如权利要求1至8任一项所述的模型生成的方法;
获取待识别客户的所述历史数据;
对所述待识别客户的所述历史数据进行预处理,以得到与所述待识别客户对应的所述第一历史序列;
对所述待识别客户对应的所述第一历史序列中所述经销商进行标注以得到所述待识别客户对应的所述第二历史序列;
对所述待识别客户对应的所述第二历史序列进行特征筛选,以得到第五历史序列,所述第五历史序列中包括所述若干特征对应的字段;
使用所述预测模型对所述第五历史序列进行预测,以得到所述待识别客户购买车险意向的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海赢科信息技术有限公司,未经上海赢科信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810450784.6/1.html,转载请声明来源钻瓜专利网。