[发明专利]一种商户欺诈风险监控系统及数据挖掘方法在审
申请号: | 202010281225.4 | 申请日: | 2020-04-11 |
公开(公告)号: | CN111612606A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 卢意 | 申请(专利权)人: | 交通银行股份有限公司上海市分行 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 上海邦德专利代理事务所(普通合伙) 31312 | 代理人: | 袁步兰 |
地址: | 200001 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 商户 欺诈 风险 监控 系统 数据 挖掘 方法 | ||
1.一种商户欺诈风险监控系统的数据挖掘方法,其特征在于,所述方法包括以下步骤:
S1根据金融部门商业目标,确定数据挖掘的目的和目标;
S2根据S1中确定的目的和目标确认数据源,并进行数据收集;
S3对收集的数据进行筛选,为数据挖掘准备数据;
S4对筛选后的数据进行质量检测,对检测后的数据进行数据整合;
S5对检测到的挖掘需要的数据、格式或变量后,进行数据转换;
S6使用不同的方法对转换后的数据进行数据挖掘得到结果数据;
S7根据信用卡收单业务情况、数据挖掘目标和商业目的来评估和解释挖掘的结果数据,形成信用卡欺诈信用评分模型;
S8利用信用卡欺诈评分模型既为银行决策层了解整体风险分布情况,为风险管理提供基础,并将其应用到收单业务之中,指导收单的业务操作。
2.根据权利要求1所述的商户欺诈风险监控系统的数据挖掘方法,其特征在于,确认数据源的时候收集全面的信息,其数据类型为业务数据、数据库/数据仓库中存储的数据或外部数据,如果银行内部不能满足构建模型所需的数据,则进行外部收集从专门收集人口统计数据、消费者信用历史数据、地理变量、商业特征和人口普查数据的企业购买得到所需要的外部数据。
3.根据权利要求1所述的商户欺诈风险监控系统的数据挖掘方法,其特征在于,对信用卡欺诈信用评分模型建设时,其模型数据选取评分的交易数据、变量提炼的交易数据、商户资料的数据或目标变量表。
4.根据权利要求3所述的商户欺诈风险监控系统的数据挖掘方法,其特征在于,所述外卡清算的数据是POS.LOG中的外卡交易记录做清算后的数据,清算的方法是返回码为‘00’,交易码为‘OFFL’,‘PRPU’,‘PURC’的交易,如果返回码为‘AUTO’,‘CANC’,则通过c_retrnum撤销或冲正相应的交易;
所述评分的交易数据加上POS.LOG中返回码不是‘00’,交易码为‘PURC’和‘OFFL’,卡号或终端号在EDCLOG中出现的外卡交易数据,后者的数据用于统计银行卡,商户和终端号的失败交易的信息;
所述商户资料的数据是评分的交易数据中出现的商户,在外卡商户资料数据中找出相关的商户信息数据,用到的信息有终端编号、邮政编码和商户类型;
所述目标变量表为查单记录中出现过的所有假卡、伪卡的卡号,并把EDCLOG中这些卡号的所有交易当作目标变量。
5.根据权利要求1所述的商户欺诈风险监控系统的数据挖掘方法,其特征在于,所述数据转换中,对于每个连续变量,作本身标准化,商户标准化,和MCC码行业标准化,采用对指标进行正态标准化(0,.1)来消除量纲的影响,对于离散数据,作数据水平归并和IV值转换。
6.根据权利要求1所述的商户欺诈风险监控系统的数据挖掘方法,其特征在于,所述信用卡欺诈信用评分模型为分类模型,所述信用卡欺诈信用评分模型用Logistic回归、神经网络和决策树方法分别建模,然后通过模型结果比较选择最佳模型。
7.根据权利要求6所述的商户欺诈风险监控系统的数据挖掘方法,其特征在于,所述Logistic回归Logistic曲线对应logistic模型,所述Logistic曲线是(0,1)区间的S形曲线,并且在Xi→-∞的情况下E(Yi)→0,在Xi→+∞时E(Yi)→1;
所述logistic模型用公式表示,这里Yi是第i个响应变量,对于响应来说该值为1,对于不响应来说该值为0,所述logistic回归模型的区间在(0,1)范围内;
对于Logistic回归模型的形式为:
其中:P是欺诈概率,α代表截距大小,β为回归系数,X代表独立变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交通银行股份有限公司上海市分行,未经交通银行股份有限公司上海市分行许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010281225.4/1.html,转载请声明来源钻瓜专利网。