[发明专利]用于执行隐案挖掘的方法和系统在审
申请号: | 201910962128.9 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110782254A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 陈志招 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06K9/62;G06Q40/04 |
代理公司: | 11315 北京国昊天诚知识产权代理有限公司 | 代理人: | 许振新;朱文杰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 样本集 多个变量 变量池 申请 计算机可读存储介质 准确度 聚类算法 样本标识 挖掘 覆盖率 案件 | ||
本申请公开了一种用于执行隐案挖掘的方法,包括:获取样本集,所述样本集包括已知黑样本和未知样本,所述已知黑样本是已经确定为风险案件的样本;获取变量池,所述变量池包括多个变量;使用所述多个变量的每一种组合,对所述样本集执行聚类算法来得到多个簇;计算所述多个簇中的每个簇中的已知黑样本的浓度;基于所述多个簇中的每个簇的已知黑样本的浓度,选择一个或多个候选簇;以及将所述一个或多个候选簇中的未知样本标识为潜在隐案。本申请还涉及相应的系统和计算机可读存储介质。本申请能够提高隐案挖掘的覆盖率、准确度和适用性。
技术领域
本说明书的一个或多个实施例涉及用于执行隐案挖掘的方法和系统。
背景技术
随着在线交易系统或支付系统的普及,与之相关联的安全问题也变得普遍,对风险案件的识别和防控也变得日益重要。风险案件包括例如盗号、欺诈、非法套现等。
在目前的在线交易系统或支付系统中,已经存在对于这些风险案件进行识别的策略。通过这些策略,很多风险案件被识别出来。另外,通过客户投诉等方式,也可以识别出一些风险案件。
然而,仍旧存在一些隐案。隐案可被定义为实际存在风险的、但是被策略漏过且没有被投诉的风险案件或者被策略拦截所以没有表现出来的风险案件,尤其是策略漏过并且没有被投诉的风险案件。在某些安全场景中(比如盗用和欺诈),风险案件通常来自于客户的投诉,但是在某些风险场景中(比如说非法套现),客户通常不会过来投诉,有的话也只是少量,因此黑样本在量上和多元性上会存在不足,相应地,策略和模型的覆盖率也会不足,所以执行隐案挖掘对于风险的主动防控就显得尤为重要。
然而,现有技术中缺少能够执行隐案挖掘的方案。即便存在这样的方案,其适用场景、覆盖率、识别效率等通常也仍有改进空间。因此,存在对于适用场景广泛、覆盖率高、识别效率高的隐案挖掘方案的需要。
发明内容
为了克服现有技术的缺陷,本说明书的一个或多个实施例提供了适用场景广泛、覆盖率高、识别效率高的隐案挖掘方案。
本说明书的一个或多个实施例通过以下技术方案来实现其上述目的。
在一个方面中,公开了一种用于执行隐案挖掘的方法,包括:获取样本集,所述样本集包括已知黑样本和未知样本,所述已知黑样本是已经确定为风险案件的样本;获取变量池,所述变量池包括多个变量;使用所述多个变量的每一种组合,对所述样本集执行聚类算法来得到多个簇;计算所述多个簇中的每个簇中的已知黑样本的浓度;基于所述多个簇中的每个簇的已知黑样本的浓度,选择一个或多个候选簇;以及将所述一个或多个候选簇中的未知样本标识为潜在隐案。
优选地,选择一个或多个候选簇包括:确定优选变量组合,所述优选变量组合体现隐案的共同特性;确定使用所述优选变量组合对所述样本集执行聚类算法得到的多个簇,作为多个初步候选簇。
优选地,确定优选变量组合包括:将每个簇的已知黑样本浓度与阈值浓度进行比较,从而确定已知黑样本浓度大于所述阈值浓度的一个或多个高黑样本浓度簇;确定未知样本的数量最多的高黑样本浓度簇;确定与所述未知样本的数量最多的高黑样本浓度簇对应的变量组合。
优选地,选择一个或多个候选簇还包括:将所述多个初步候选簇选择为所述候选簇。
优选地,选择一个或多个候选簇还包括:将所述多个初步候选簇中的每个初步候选簇的已知黑样本浓度与第二阈值浓度进行比较;以及将所述多个初步候选簇中已知黑样本浓度大于第二阈值浓度的初步候选簇选择为所述候选簇。
优选地,选择一个或多个候选簇包括:将每个簇的已知黑样本浓度与阈值浓度进行比较,从而确定已知黑样本浓度大于所述阈值浓度的一个或多个高黑样本浓度簇;计算所述一个或多个高黑样本浓度簇中的未知样本的数量;按照未知样本的数量从多到少对所述一个或多个高黑样本浓度簇排序;以及选择排序最高的多个高黑样本浓度簇作为所述候选簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910962128.9/2.html,转载请声明来源钻瓜专利网。