[发明专利]一种识别欺诈客户的方法、装置及电子设备在审
申请号: | 201911083007.3 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110930218A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 宋晓娣;王湾湾;姚明 | 申请(专利权)人: | 中诚信征信有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q40/00 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;马敬 |
地址: | 100011 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 欺诈 客户 方法 装置 电子设备 | ||
1.一种识别欺诈客户的方法,其特征在于,包括:
确定第一预设数量个待划分数据集,每个待划分数据集中包括随机选取的第二预设数量的待识别客户;
分别针对每个待划分数据集执行以下三个步骤:
步骤1、随机选取待识别客户的一类特征信息,根据选取的特征信息对该待划分数据集中的待识别客户进行二分类,得到两个数据子集;
步骤2、随机选取待识别客户的一类特征信息,根据选取的特征信息分别对每个数据子集中的待识别客户进行二分类,将每个数据子集划分为两个数据子集;
步骤3、重复执行所述步骤2,直至得到的所有数据子集中只包括第一类数据子集和/或第二类数据子集,所述第一类数据子集为只包括一个待识别客户的数据子集,所述第二类数据子集为进行预设次数的分类后得到的包括至少两个待识别客户的数据子集;
针对所述第一预设数量个待划分数据集中的每个待识别客户,根据该待识别客户所属的第一类数据子集或第二类数据子集对应的分类次数,确定该待识别客户的异常分数;
构建训练集,所述训练集中包括欺诈客户的各类特征信息和正常客户的各类特征信息,所述欺诈客户为异常分数大于预设分数值的待识别客户,所述正常客户为异常分数小于等于所述预设分数值的待识别客户;
根据所述训练集对机器学习模型进行训练,得到欺诈识别模型,所述欺诈识别模型用于识别待识别客户是否为欺诈客户。
2.根据权利要求1所述的方法,其特征在于,所述针对所述第一预设数量个待划分数据集中的每个待识别客户,根据该待识别客户所属的第一类数据子集或第二类数据子集对应的分类次数,确定该待识别客户的异常分数,包括:
针对所述第一预设数量个待划分数据集中的每个待识别客户,确定该待识别客户所属的第一类数据子集或第二类数据子集对应的分类次数;
针对每个待划分数据集,根据该待识别客户在该待划分数据集中所属的第一类数据子集的分类次数或第二类数据子集的分类次数,确定该待识别客户在该待划分数据集中的被分类次数;
根据该待识别客户在每个待划分数据集中的被分类次数,计算该待识别客户的被分类次数的平均值;
根据该待识别客户的被分类次数的平均值,确定该待识别客户的异常分数。
3.根据权利要求2所述的方法,其特征在于,所述针对每个待划分数据集,根据该待识别客户在该待划分数据集中所属的第一类数据子集的分类次数或第二类数据子集的分类次数,确定该待识别客户在该待划分数据集中的被分类次数,包括:
针对每个待划分数据集,若该待识别客户属于该待划分数据集中的第一类数据子集,则确定该待识别客户在该待划分数据集中的被分类次数为:该待识别客户在该待划分数据集中所属的第一类数据子集对应的分类次数;
若该待识别客户属于该待划分数据集中的第二类数据子集,则通过以下公式,计算该待识别客户在该待划分数据集中的被分类次数:
h(x)=e+C(T)
其中,所述h(x)表示该待识别客户在该待划分数据集中的被分类次数,所述e表示所述预设次数,所述C(T)表示修正函数,所述T表示该待识别客户在该待划分数据集下所属的第二类数据子集中的待识别客户的数量,H(T-1)=ln(T-1)+0.5772156649;
所述根据该待识别客户的被分类次数的平均值,确定该待识别客户的异常分数,包括:
根据该待识别客户的被分类次数的平均值,通过以下公式,计算该待识别客户的异常分数:
其中,所述score(x)表示该待识别客户的异常分数,所述E(h(x))表示所述平均值,所述C(n)表示归一化处理的修正函数,所述n表示所述第二预设数量,H(n-1)=ln(n-1)+0.5772156649。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中诚信征信有限公司,未经中诚信征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911083007.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种投递请求的确定方法和装置
- 下一篇:热泵烘干系统、烘干方法、装置及控制器