[发明专利]识别风险社区的方法及系统有效
申请号: | 202010412656.X | 申请日: | 2020-05-15 |
公开(公告)号: | CN111738817B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 董肖凯;黄乐平;丁可 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F16/901;G06F16/906 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 盛安平 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 风险 社区 方法 系统 | ||
1.一种识别风险社区的方法,其特征在于,包括:
创建指定业务场景下用户的风险网络,并从所述风险网络中提取用户的邻接矩阵;
依据所述指定业务场景下用户的风险特征和拓扑特征构建用户的相似度矩阵;
利用所述邻接矩阵和所述相似度矩阵建立用户的相似关联矩阵,针对所述相似关联矩阵进行聚类运算,得到各个用户所归属的社区;
基于所述社区的置信度和紧密度筛选出风险社区;
其中,所述利用所述邻接矩阵和所述相似度矩阵建立用户的相似关联矩阵,针对所述相似关联矩阵进行聚类运算,得到各个用户所归属的社区的步骤,包括:将所述邻接矩阵和所述相似度矩阵进行矩阵乘法运算,得到用户的相似关联矩阵;遍历所述相似关联矩阵中的节点,得到与从属节点的相似度大于预设的相似度阈值、同时从属节点的数量大于从属节点个数阈值的所有节点作为核心点;创建聚类模型并进行校正,利用校正后的聚类模型对每个所述核心点进行广度优先遍历,将所述核心点的标签赋予对应的从属节点,并利用所述标签区分得到各个节点所属的社区。
2.根据权利要求1所述的识别风险社区的方法,其特征在于,创建指定业务场景下用户的风险网络,并从所述风险网络中提取用户的邻接矩阵的方法包括:
以所有业务场景的用户为节点挖掘原生网络;
将一个具有风险记录的用户作为所述指定业务场景下的种子节点,由所述种子节点衍生出一度及一度以上的用户的风险网络;
从所述风险网络中提取用户的邻接矩阵。
3.根据权利要求1或2所述的识别风险社区的方法,其特征在于,所述风险网络包括一度风险网络至四度风险网络;所述邻接矩阵包括一度邻接 矩阵和二度邻接矩阵。
4.根据权利要求1所述的识别风险社区的方法,其特征在于,依据所述指定业务场景下用户的风险特征构建用户的相似度矩阵的方法包括:
针对指定业务场景提取用户的风险特征,同时提取用户在所述指定业务场景的用户关系网络中的拓扑特征;
将所述风险特征及所述拓扑特征进行标准化处理和筛选,得到优质风险特征和优质拓扑特征;
基于所述优质风险特征和所述优质拓扑特征,以欧式距离或马氏距离作为相似度的衡量标准计算任意两个用户之间的相似度,并构建用户的相似度矩阵。
5.根据权利要求4所述的识别风险社区的方法,其特征在于,所述风险特征包括用户的基础属性、设备信息、支付金额和支付频次;
所述拓扑特征包括出度、入度、中介中心度、度中心度和pagerank值;
利用sigmod变换将所述风险特征和所述拓扑特征进行标准化处理;
采用熵值法或变异系数法对标准化处理后的风险特征和拓扑特征进行筛选,得到优质风险特征和优质拓扑特征。
6.根据权利要求1所述的识别风险社区的方法,其特征在于,利用所述聚类模型对一个核心点进行广度优先遍历,将所述核心点的标签赋予对应的从属节点的方法包括:
判断所述核心点有无标签,若无标签则为所述核心点赋予标签;
采用广度优先遍历,搜索与所述核心点的相似度大于所述相似度阈值的所有从属节点,并将所述核心点的标签赋予所述从属节点;
直至将所述核心点的所有从属节点赋予标签。
7.根据权利要求1所述的识别风险社区的方法,其特征在于,校正所述聚类模型的方法包括:
计算每个节点的相似轮廓系数,并将所有节点的相似轮廓系数求平均值作为所述聚类模型运算得到的社区的相似轮廓系数;
计算所述聚类模型运算得到的社区的模块度;
以所述相似轮廓系数及所述模块度作为指标,对所述聚类模型进行校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010412656.X/1.html,转载请声明来源钻瓜专利网。