[发明专利]基于人工智能的风险识别方法、装置、计算机设备及介质有效
申请号: | 202010798036.4 | 申请日: | 2020-08-10 |
公开(公告)号: | CN111950625B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 卢佳卉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/22;G06F18/24;G06N3/08;G06V30/14;G06Q40/04 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈敬华 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 风险 识别 方法 装置 计算机 设备 介质 | ||
本发明涉及人工智能技术领域,提供一种基于人工智能的风险识别方法、装置、计算机设备及介质,包括:采用XDeep FM模型提取出多个结构化数据中的多个高阶特征数据;根据结构化数据和高阶特征生成正负样本数据集,根据正负样本数据集中的风险样本对之间的相似度确定正负样本数据集的相似度分布,根据相似度分布为正负样本数据集生成不同的权重;基于正样本数据集及对应的权重、负样本数据集及对应的权重训练神经网络得到风险识别模型;输入目标用户的多个目标用户数据至所述风险识别模型中进行识别得到风险级别。本发明可应用于金融领域,能够提高识别用户的风险级别的准确率。
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的风险识别方法、装置、计算机设备及介质。
背景技术
随着互联网、物联网、传感器等技术的快速发展,催生出了一种新的金融工具-互联网金融服务。互联网金融服务能够为没有抵押品且很可能被传统金融机构拒绝的人群提供了帮助,在金融领域中起着重要作用。对于提供此类金融服务的平台,主要挑战在于对用户进行风险管理和信用评分。
然而,发明人在实现本发明的的过程中发现,在对用户进行风险管理时,经常要面对大量原始数据,而传统的风险评分或者信用评分在很大程度上取决于领域专家知识,且一次仅能构建一个特征,特征构建效率极其低下,导致风险评估效率较低;此外,凭直觉和反复试验构建的特征和权重,导致风险评估准确率较低。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的风险识别方法、装置、计算机设备及介质,能够自动生成数据集并为数据集分配不同的权重,能够提高识别用户的风险级别的准确率。
本发明的第一方面提供一种基于人工智能的风险识别方法,所述方法包括:
对多个用户数据进行结构化处理得到多个结构化数据;
采用XDeep FM模型提取出所述多个结构化数据中的多个高阶特征数据;
根据所述多个结构化数据和所述多个高阶特征生成正样本数据集和负样本数据集,所述正样本数据集包括多个第一风险样本对,所述负样本数据集包括多个第二风险样本对;
根据所述第一风险样本对之间的相似度确定所述正样本数据集的第一相似度分布,根据所述第二风险样本对之间的相似度确定所述负样本数据集的第二相似度分布;
根据所述第一相似度分布为所述正样本数据集生成第一权重,根据所述第二相似度分布为所述负样本数据集生成第二权重;
基于所述正样本数据集及所述第一权重、所述负样本数据集及所述第二权重训练神经网络得到风险识别模型;
输入目标用户的多个目标用户数据至所述风险识别模型中进行识别得到风险级别。
根据本发明的一个可选的实施例,所述根据所述多个结构化数据和所述多个高阶特征生成正样本数据集和负样本数据集包括:
将所述多个高阶特征数据与所述多个结构化数据进行两两组合得到多个样本数据;
为每个用户数据生成第一风险标识或者第二风险标识;
根据所述第一风险标识及与所述第一风险标识对应的样本数据生成正样本数据集;
根据所述第二风险标识及与所述第二风险标识对应的样本数据生成负样本数据集。
根据本发明的一个可选的实施例,所述对多个用户数据进行结构化处理得到多个结构化数据包括:
获取所述多个用户数据中的多个非结构化数据及多个原始结构化数据;
采用证据权重算法对所述多个非结构化数据进行编码得到多个编码数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010798036.4/2.html,转载请声明来源钻瓜专利网。