[发明专利]欺诈群体识别方法、装置、服务器及存储介质在审
申请号: | 202010923966.8 | 申请日: | 2020-09-04 |
公开(公告)号: | CN114155012A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 孙果;魏睐;黄婉棉;彭南博 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 群体 识别 方法 装置 服务器 存储 介质 | ||
1.一种欺诈群体识别方法,其特征在于,包括:
获取待处理的用户访问数据,所述用户访问数据具有多个特征属性;
根据所述用户访问数据,建立用户与访问主体之间的二部图关联网络和数据特征空间,所述数据特征空间的维度与所述特征属性的个数一致;
根据所述数据特征空间中每个特征属性的取值分布,对所述二部图关联网络对应的全量用户群体进行识别,确定出所述全量用户群体中的欺诈群体。
2.根据权利要求1所述的方法,其特征在于,所述根据所述数据特征空间中每个特征属性的取值分布,对所述二部图关联网络对应的全量用户群体进行识别,确定出所述全量用户群体中的欺诈群体,包括:
A1、确定所述数据特征空间中每个特征属性的取值分布;
A2、根据每个特征属性的取值分布,从每个取值分布中确定出目标删除取值,其中,所述全量用户群体中删除所述目标删除取值对应用户后剩余用户群体与所述全量用户群体在所述特征属性上的显著度指标最大,且所述数据特征空间删除所述目标删除取值后的密集度增大;
A3、在所述数据特征空间中对应特征属性的取值分布中删除所述目标删除取值,并更新所述数据特征空间;
A4、针对所述数据特征空间中的每个特征属性,执行步骤A1至A3,直至所述数据特征空间中所有特征属性的剩余取值均满足预设条件,得到最后一次更新的数据特征空间;
A5、将所述最后一次更新的数据特征空间对应的用户群体,确定为所述欺诈群体。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据预设的异常群体数量,执行所述A1至所述A5,在所述二部图关联网络中确定出所述异常群体数量的欺诈群体。
4.根据权利要求2所述的方法,其特征在于,所述根据每个特征属性的取值分布,从每个取值分布中确定出目标删除取值,包括:
根据每个特征属性的取值分布,构建每个特征属性对应的最小堆树;
对于每个最小堆树,根据所述最小堆树中每个根节点的取值,计算每个取值删除时的数据特征空间的密集度和所述全量用户群体中删除所述取值对应的用户后的剩余用户群体与所述全量用户群体在所述特征属性上的显著度指标;
根据每个取值删除时的数据特征空间的密集度和所述全量用户群体中删除所述取值对应的用户后的剩余用户群体与所述全量用户群体在所述特征属性上的显著度指标,将显著度指标最大且密集度增大的取值作为所述目标删除取值。
5.根据权利要求4所述的方法,其特征在于,所述根据每个特征属性的取值分布,构建每个特征属性对应的最小堆树,包括:
根据每个特征属性的取值分布,确定每个特征属性的取值和每个取值的出现频次;
以根节点属性值的出现频次小于或等于左右子节点属性值的出现频率为依据,构建每个特征属性对应的最小堆树。
6.根据权利要求2-5任一项所述的方法,其特征在于,所述密集度是所述数据特征空间中所有待检测空间块的平均质量,所述平均质量为所有待检测空间块的质量和与待检测空间块的数量的比值,所述待检测空间块的质量是在每个特征属性上用户与访问主体的交互频次。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述用户访问数据,建立用户与访问主体之间的二部图关联网络和数据特征空间,包括:
对所述用户访问数据进行分析,确定每个用户与访问主体的关联关系以及每个用户携带的特征属性和每个访问主体携带的特征属性;
根据每个用户与访问主体的关联关系,构建所述二部图关联网络;
根据每个用户携带的特征属性和每个访问主体携带的特征属性,生成所述数据特征空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010923966.8/1.html,转载请声明来源钻瓜专利网。