[发明专利]基于人工智能的风险识别方法、装置、计算机设备及介质有效
申请号: | 202010798036.4 | 申请日: | 2020-08-10 |
公开(公告)号: | CN111950625B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 卢佳卉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/22;G06F18/24;G06N3/08;G06V30/14;G06Q40/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈敬华 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 风险 识别 方法 装置 计算机 设备 介质 | ||
1.一种基于人工智能的风险识别方法,其特征在于,所述方法包括:
对多个用户数据进行结构化处理得到多个结构化数据;
采用XDeep FM模型提取出所述多个结构化数据中的多个高阶特征数据;
根据所述多个结构化数据和所述多个高阶特征生成正样本数据集和负样本数据集,所述正样本数据集包括多个第一风险样本对,所述负样本数据集包括多个第二风险样本对;
根据所述第一风险样本对之间的相似度确定所述正样本数据集的第一相似度分布,根据所述第二风险样本对之间的相似度确定所述负样本数据集的第二相似度分布;
根据所述第一相似度分布为所述正样本数据集生成第一权重,根据所述第二相似度分布为所述负样本数据集生成第二权重;
基于所述正样本数据集及所述第一权重、所述负样本数据集及所述第二权重训练神经网络得到风险识别模型;
输入目标用户的多个目标用户数据至所述风险识别模型中进行识别得到风险级别。
2.如权利要求1所述的基于人工智能的风险识别方法,其特征在于,所述根据所述多个结构化数据和所述多个高阶特征生成正样本数据集和负样本数据集包括:
将所述多个高阶特征数据与所述多个结构化数据进行两两组合得到多个样本数据;
为每个用户数据生成第一风险标识或者第二风险标识;
根据所述第一风险标识及与所述第一风险标识对应的样本数据生成正样本数据集;
根据所述第二风险标识及与所述第二风险标识对应的样本数据生成负样本数据集。
3.如权利要求1所述的基于人工智能的风险识别方法,其特征在于,所述对多个用户数据进行结构化处理得到多个结构化数据包括:
获取所述多个用户数据中的多个非结构化数据及多个原始结构化数据;
采用证据权重算法对所述多个非结构化数据进行编码得到多个编码数据;
对所述多个编码数据及所述多个原始结构化数据进行数据清洗得到多个结构化数据。
4.如权利要求1所述的基于人工智能的风险识别方法,其特征在于,所述根据所述第一相似度分布为所述正样本数据集生成第一权重,根据所述第二相似度分布为所述负样本数据集生成第二权重包括:
基于所述第一相似度分布及所述第二相似度分布,确定分类正确的第一样本数据集及确定分类错误的第二样本数据集;
将所述第一相似度分布与所述第二相似度分布的交叉点对应的相似度作为样本数据集的相似度分布的均值;
在所述均值的基础上减少预设第一值并作为所述第一样本数据集中每个风险样本对的第一权重;
在所述均值的基础上增加预设第二值并作为所述第二样本数据集中每个风险样本对的第二权重。
5.如权利要求4所述的基于人工智能的风险识别方法,其特征在于,在确定分类正确的第一样本数据集及确定分类错误的第二样本数据集之后,所述方法还包括:
对所述第一样本数据集进行缺失值填充得到第一目标样本数据集,对所述第二样本数据集进行缺失值填充得到第二目标样本数据集;
计算所述第一目标样本数据集的第一群体稳定性指标和第一信息价值指标,及计算所述第二目标样本数据集的第二群体稳定性指标和第二信息价值指标;
根据所述第一群体稳定性指标和所述第一信息价值指标更新所述第一目标样本数据集,及根据所述第二群体稳定性指标和所述第二信息价值指标更新所述第二目标样本数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010798036.4/1.html,转载请声明来源钻瓜专利网。