[发明专利]基于新型特征优化算法的车险诈骗识别方法、装置及设备在审
申请号: | 202310370147.9 | 申请日: | 2023-04-07 |
公开(公告)号: | CN116579861A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | 何晓霞;颜巍;文艺;张铎;易显龙 | 申请(专利权)人: | 中国人民财产保险股份有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06F18/214;G06F18/27;G06N20/20 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王治东 |
地址: | 100022 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 新型 特征 优化 算法 车险 诈骗 识别 方法 装置 设备 | ||
本发明公开了一种基于新型特征优化算法的车险诈骗识别方法、装置及设备,该方法包括:获取车险理赔欺诈的待测数据集;基于分类模型对待测数据集进行分类处理,得到分类结果;其中,分类模型通过训练集完成训练,训练集为通过综合采样算法SMOTEEN进行平衡处理以及通过本发明提出的特征选择算法EFS_BR优化后的数据集;分类结果用于反映是否存在车险理赔欺诈行为。本发明能够达到剔除无用特征、降低模型计算复杂度和提高模型识别率的效果。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于新型特征优化算法的车险诈骗识别方法、装置及设备。
背景技术
现有的基于人工智能构建保险反欺诈模型主要设计思路是:基于保险欺诈的特征数据集,使用机器学习或深度学习方法训练分类模型,使用训练好的分类模型对是否会存在保险欺诈的行为进行预测。目前,研究者大多使用贝叶斯网络、支持向量机、随机森林、高斯异常检测、聚类等机器学习算法,使模型的风险识别率达到80%。
虽然现有的基于机器学习的保险欺诈检测模型能够避免人工检查骗保行为耗时耗力的缺点,但仍存在着如下缺点:
1、基于监督型的机器学习算法在处理不平衡的保险欺诈样本数据会发生分类偏倚问题。
分类偏倚指的是样本数据集中的正负样本分布不均。在实际场景中,存在欺诈行为的负样本数量是远远少于正常的车险理赔样本,这在训练完后,模型虽然能高效识别正常样本,却难以正确识别负类样本。
2、现有的基于特征工程训练的检测模型未进一步对特征进行优化以提升模型检测效果。
在现实应用中,研究者会尽可能收集较多的特征用于训练以提高检测效果。这些特征集合中可能含有冗余特征,即对模型的分类效果影响较小或者降低模型效果的特征。且特征维度越大,计算的复杂度越高。
3、传统的嵌入式特征选择算法忽视了强关联性特征,选择了弱关联特征,可能会导致模型对未来数据的预测效果不佳。
发明内容
本发明提供了一种基于新型特征优化算法的车险诈骗识别方法、装置及设备,解决了上述问题。
一种基于新型特征优化算法的车险诈骗识别方法,包括:
获取车险理赔欺诈的待测数据集;
基于分类模型对所述待测数据集进行分类处理,得到分类结果;
其中,所述分类模型通过训练集完成训练,所述训练集为通过综合采样算法进行平衡处理以及通过特征选择算法EFS_BR优化后的数据集;所述分类结果用于反映是否存在车险理赔欺诈行为。
在本发明的一种实施例中,在通过特征选择算法EFS_BR优化训练集的过程中,所述方法还包括:获取平衡处理后的训练集数据矩阵X,所述训练集数据矩阵X包括n个样本和d个特征;通过嵌入式特征选择算法从所述训练集数据矩阵X中的所有特征中选择s个特征,根据选择的s个特征确定被选择的特征数据矩阵FS;根据未被选择的d-s个特征确定未被选择的特征数据矩阵UFS。
在本发明的一种实施例中,在通过特征选择算法EFS_BR优化训练集的过程中,所述方法还包括:通过过滤式特征选择算法确定所述被选择的特征数据矩阵FS和未被选择的特征数据矩阵UFS中每个特征和标签的关联度;根据所述关联度从所述被选择的s个特征中筛选出关联度较高的k个特征,并生成关于所述k个特征的第一矩阵;根据所述关联度从所述未被选择的d-s个特征中筛选出关联度较高的t个特征,并生成关于所述t个特征的第二矩阵;将所述第一矩阵和所述第二矩阵进行合并,得到合并矩阵W,以剔除FS中关联度未达到关联度阈值的特征;根据所述合并矩阵W训练基模型,所述基模型采用逻辑回归分类算法;计算所述基模型的分类损失值,根据所述分类损失值确定最终输出的合并矩阵W*,作为优化后的训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民财产保险股份有限公司,未经中国人民财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310370147.9/2.html,转载请声明来源钻瓜专利网。