[发明专利]风险识别方法及装置和电子设备在审
申请号: | 202010782472.2 | 申请日: | 2020-08-06 |
公开(公告)号: | CN111915312A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 姜磊;周祎萍 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06Q10/06;G06F40/279;G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 识别 方法 装置 电子设备 | ||
1.一种风险识别方法,应用于风险识别引擎,所述风险识别引擎包括名单匹配模块和特征匹配模块;其中,所述名单匹配模块中配置有风险名单,所述特征匹配模块中配置有特征变量及对应的特征阈值;所述方法包括:
获取待识别交易的交易数据;
将所述交易数据输入到名单匹配模块,由所述名单匹配模块中的名单匹配算法,计算名单分值;其中,所述名单分值用于表示所述交易数据中的交易方信息与风险名单之间的匹配程度;
将所述交易数据输入到特征匹配模块,由所述特征匹配模块中的特征匹配算法,计算特征分值;其中,所述特征分值用于表示所述交易数据对应特征变量的特征值与特征阈值之间的匹配程度;
将所述名单分值和特征分值,输入训练完成的分类器中进行计算,得到所述待识别交易的风险识别结果。
2.根据权利要求1所述的方法,所述计算名单分值,包括:
从所述交易数据中确定至少一个交易方的交易方信息;
遍历风险名单内记录的名单信息,计算每个名单信息与该交易方信息之间的相似度;
基于所计算出的相似度,确定所述交易数据对应的名单分值。
3.根据权利要求1所述的方法,所述特征匹配模块中的特征变量随历史交易数据的积累而动态调整,所述动态调整的过程,包括:
获取积累的历史交易数据,并从所述历史交易数据中提取待筛选的特征变量;
对所述待筛选的特征变量进行筛选,筛选出对风险识别结果存在影响的特征变量;其中,所述筛选出的特征变量用于配置到所述特征匹配模块中。
4.根据权利要求3所述的方法,所述对所述待筛选的特征变量进行筛选,筛选出对风险识别结果存在影响的特征变量,包括:
根据所述历史交易数据,计算所述待筛选的特征变量的信息值IV和/或证明力权重WOE;
筛选出的将信息值IV大于第一阈值,和/或证明力权重WOE大于第二阈值的特征变量。
5.根据权利要求4所述的方法,所述历史交易数据分为黑样本和白样本;
针对任一特征变量,根据以下公式计算该特征变量的第i个特征值区间对应的信息值:
其中,pni表示具有该特征变量的第i个特征值区间中的特征值的黑样本数目占获取的黑样本总数目的比例,pyi表示具有该特征变量的第i个特征值区间中的特征值的白样本数目占获取的白样本总数目的比例,WOEi表示该特征变量的第i个特征值区间对应的证明力权重,m为该特征变量的特征值区间数目。
6.根据权利要求5所述的方法,针对任一特征变量,根据以下公式确定该特征变量的第i个特征值区间对应的证明力权重:
WOEi=ln(pni/pyi);
其中,pni=ni/N,pyi=yi/Y,ni为具有第i个特征值区间中的特征值的黑样本数目,N为获取的黑样本总数目,yi为具有第i个特征值区间中的特征值的白样本数目,Y为获取的白样本总数目。
7.根据权利要求3所述的方法,所述特征阈值随每次特征变量的调整而重新确定,所述特征阈值确定的过程包括:
将所述历史交易数据的特征值与特征阈值进行比较,验证所述特征阈值是否满足要求;
如果不满足,利用优化算法,调整所述特征阈值后,直至变量阈值满足要求。
8.根据权利要求1所述的方法,所述特征匹配算法包括基于机器学习技术训练得到的模型;所述模型的训练过程包括:
获取累积的历史交易数据;
根据所述历史交易数据符合的概率分布类型,构建该概率分别类型对应的损失函数;
基于所述历史交易数据对所述损失函数进行训练,并集合最优化算法,对所述损失函数进行优化,以训练出所述损失函数中各个参数的最优值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010782472.2/1.html,转载请声明来源钻瓜专利网。