[发明专利]理赔客户风险识别方法及系统在审
申请号: | 201810706897.8 | 申请日: | 2018-07-02 |
公开(公告)号: | CN108694520A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | 冯晓俊;夏如雪;夏天;羿然 | 申请(专利权)人: | 平安健康保险股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/08 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 林彦之 |
地址: | 200030 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客户 风险识别 就诊费用 就诊信息 模型实施 模型训练 数据准备 个人信息 数据集中 特征输入 大数据 数据集 训练集 训练器 采集 医疗 | ||
1.一种理赔客户风险识别方法,其特征在于包括数据准备阶段、模型训练阶段、模型实施阶段,
其中,所述数据准备阶段包括以下步骤:
步骤A1、从医疗理赔大数据中获取与理赔客户风险相关的数据,包括理赔客户的个人信息和就诊信息,所述就诊信息包括就诊费用信息;
步骤A2、从所述数据中提取训练GBM模型所需的特征,形成数据集,
其中,所述模型训练阶段包括以下步骤:
步骤B1、将所述数据集中的部分数据作为训练集,输入GBM模型的训练器,进行训练;
步骤B2、生成训练完毕的GBM模型,
其中,所述模型实施阶段包括以下步骤:
步骤C1、采集理赔客户的当前理赔数据,并提取GBM模型所需的特征,
步骤C2、将特征输入所述GBM模型,生成识别结果,所述识别结果包括所述理赔客户未来可能产生的就诊费用。
2.根据权利要求1所述的理赔客户风险识别方法,其特征在于,训练GBM模型所需的特征包括:
所述理赔客户的人口学特征、地理特征、就诊时间特征、医疗特征、费用特征;
通过计算获得的二次数据,包括所述理赔客户的就诊频率、就诊费用随时间的分布、时间段总花费、费用构成比例。
3.根据权利要求1所述的理赔客户风险识别方法,其特征在于,所述GBM模型的训练器是XGBoost。
4.根据权利要求2所述的理赔客户风险识别方法,其特征在于,所述与理赔客户风险相关的数据还包括所述理赔客户的风险级别,
其中,所述模型实施阶段还包括以下步骤:
步骤C3、根据所述理赔客户未来可能产生的就诊费用,判定所述理赔客户的风险级别。
5.根据权利要求4所述的理赔客户风险识别方法,其特征在于,通过医疗理赔统计数据,得到所述理赔客户未来可能产生的就诊费用所在的分位点p,其中分位点p的取值范围为0至100,对应于所述就诊费用在所述理赔中的百分数位置,
并且,根据所述分位点判定所述理赔客户的风险级别。
6.根据权利要求1所述的理赔客户风险识别方法,其特征在于还包括与模型训练阶段同步的模型测试阶段,包括以下步骤:
步骤D1、将数据集中的部分数据作为测试集,输入GBM模型的训练器,进行测试,其中,所述测试集与所述训练集的数据不重叠;
步骤D2、在所述训练阶段的训练过程中,通过所述测试集对迭代中的GBM模型进行测试,得到不同迭代次数下的GBM模型针对训练集和测试集的错误率和/或性能分数;
步骤D3、根据所述错误率和/或性能分数,确定GBM模型的最终迭代次数、为最终模型保留的树的数量。
7.根据权利要求1所述的理赔客户风险识别方法,其特征在于还包括模型验证阶段,包括以下步骤:
采用与步骤A2中的数据集独立的数据集,对已生成的GBM模型进行性能验证。
8.一种用于执行根据权利要求1至7中的任一个所述的方法的理赔客户风险识别系统,其特征在于数据准备模块、模型训练模块、模型实施模块,
其中,所述数据准备模块用于:
从医疗理赔大数据中获取与理赔客户风险相关的数据,包括理赔客户的个人信息和就诊信息,所述就诊信息包括就诊费用信息;
从所述数据中提取训练GBM模型所需的特征,形成数据集,
其中,所述模型训练模块用于:
将所述数据集中的部分数据作为训练集,输入GBM模型的训练器,进行训练;
生成训练完毕的GBM模型,
其中,所述模型实施模块用于:
采集理赔客户的当前理赔数据,并提取GBM模型所需的特征,
将特征输入所述GBM模型,生成识别结果,识别结果包括所述理赔客户未来可能产生的就诊费用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安健康保险股份有限公司,未经平安健康保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810706897.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种针对差异化人群的地铁服务质量评估方法
- 下一篇:个人风险定价方法及系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理