[发明专利]一种基于复杂网络的要素异常结构检测模型构建方法有效
申请号: | 201911033009.1 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110795807B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 王文凯;何东晓;武南南;孙越恒;潘林;王文俊 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06Q40/02;G06Q50/00;G06N7/01 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 网络 要素 异常 结构 检测 模型 构建 方法 | ||
1.一种基于复杂网络的非法集资行为检测模型构建方法,其特征在于,步骤如下:
首先根据依存的银行交易流水,利用抽取的交易关系构建交易关系网络,找出交易的爆发时间区间,以及每个客户的可疑度P计算;
然后,在交易爆发区间内找出可疑的客户并检测出可疑的最大连通子图;
所述交易关系,包含以下步骤:
a.首先对行内数据进行清洗选择,交易关系的抽取,以及交易流水与客户账户信息的对接,最后必须对于那些涉及个人隐私的私密数据要进行筛除脱密处理;
b.其次对真实的交易关系网建模分析,给出模型的非法集资行为的形式化定义:
G=(V,E,M,T)
V表示图中的节点集合,节点表行内客户,S表示一个交易子图,E表示图中的边集合,代表客户之间的交易关系,M代表交易的钱数,T表示交易发生的时间;
c.下一步引入扫描统计量来计算交易客户节点的可疑度,扫描统计量是指在网络环境下的一个数学变量,并且应用于检测一个子图上观测到的数据突然增加,其中观测到的数据表示在该子图S上每个节点的观测到的值;
使用经验P值,来建模数据的分布,该客户ν在时间T的经验P值pT(v),如公式:
为每一个顶点赋值了一个经验P值,为了检测数据的异常,给出一个置信水平α;
d.在交易网络找到短暂的爆发和消亡区间:
一般非法集资会在短时间内进行集资行为,而且集资完成后会突然消失;
为了考虑上面描述的突发和消亡的模式,需要确定交易时间序列T中爆发的起始点和跌落的结束点:爆发点为(tm,cm),最大值为cm;
交易时间序列T,辅助线ι,辅助线从左下点(t0,c0),到右上点(tm,cm),那么最大点(tm,cm)的觉醒点为交易时间序列到辅助线最大的距离的点,觉醒点(ta,ca)满足:
e.同样的方法找到消亡点,然后求出Δc,Δc为爆发点与觉醒点的高度差,以及两点间斜率,还有爆发区间,即觉醒点到爆发点的时间段,觉醒爆发点对的高度差至少占时间序列的前50%,也就是说高度差过小的不计入考虑范围内,找出交易爆发区间。
2.根据权利要求1所述的一种基于复杂网络的非法集资行为检测模型构建方法,其特征在于,利用计算出的爆发区间以及客户的可疑度,挖掘非法集资行为子图,包含以下步骤:
a.针对异常子图,具有两个非常直观的性质,即:(1)异常子图应该包含尽可能多的异常顶点;(2)异常子图应该包含尽可能少的正常节点;
b.利用计算出的爆发区间,在每个爆发区间计算出客户的P值,然后构成一个小的交易网络;
c.为了满足上述两条性质并且必须构成连通子图,考虑使用贪婪算法:首先在一个时间窗口内,选取k个P值最小的客户点,及最可疑的点,然后逐步迭代,类似于最小生成树算法,构建出最可疑的非法集资集团;
d.评估因果关系网络预测的结果,采用计算精确率Pre值,召回率R值和F值进行评估,计算精确率的公式如下:
计算召回率的公式如下:
计算F值的公式如下
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911033009.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智联网体系架构
- 下一篇:一种脑环境参数确定装置、方法及电子设备