[发明专利]一种稠密多部子图的检测方法及系统在审
申请号: | 202010071390.7 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111291229A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 刘盛华;石川;程学旗;李香峰;沈华伟;刘财政 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9035;G06Q40/04 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 稠密 多部子图 检测 方法 系统 | ||
本发明提出一种基于稠密多部子图的检测方法及系统,包括:步骤1、根据链式特征中的信息流动,构建交易网络的多部图,根据预设的账户间信息流动阈值筛选该多部图,得到该多部图中的稠密子图;步骤2、以固定账户存在超阈值的信息流且在中间账户中保留低于阈值的权重为约束条件,生成该稠密子图中节点子集的异常值;步骤3、根据该异常值,输出该多部图中存在异常行为的节点子集作为异常行为检测结果。本发明通过具有有效性和鲁棒性和良好的可扩展性。
技术领域
本发明涉及数据挖掘领域,特别涉及一种稠密多部子图的检测方法及系统。
背景技术
随着互联网的发展,互联网应用获得了飞速发展,社交媒体也获得了飞速 发展,目前社交媒体已超越搜索引擎,成为互联网第一大流量来源,二者占比 分别为46%和40%。而随着技术的发展,恶意话题操作以及洗钱等也成为了 不法分子的谋取暴力的工具。恶意话题炒作是一些团伙通过相互转发信息来炒 作某个话题,从而获得舆论影响力、宣传推广等目的;互洗钱是将从非法来源 获得的资金转化为合法资金的过程。图成为一种常见数据应用到许多科学和工 程中,图可以表示成这样一种结构,即图G=(V,E)是一对集合:一组顶点 V表示实体和一组边E表示实体之间的关系或连接。在计算机科学中,网络包含节点和边缘;而在社会科学中,相应的术语则是行为者和关系,在本文中这 两个术语具有同等意义。如果用图中的顶点表示参与活动的人,用边表示消息 或者人与人之间的关联。那么当发起媒体炒作或者洗钱行为时,会在特定时间 或者特定常见下,参与活动的人之间产生一个多部稠密子图。用户之间的相互 关注关系就构成了社交网络图,其常见的存储格式是邻接矩阵或者拉普拉斯矩 阵,邻接矩阵如图1所示,当两个节点之间右边相连时,对应的位置置为1, 如果两个节点之间无边相连,对应的位置置为0,如果是有权图,对应位置置 为权值,无边相连对应位置置为极大的值,但是其特征几乎相同。
图2显示了一个洗钱的案例,包含从源账户到中间账户到目标账户的两步 资金转移流程。为了隐藏资金的真实来源和去向,洗钱者往往通过多层中间账 户(可以是银行内或银行间转账)隐秘的将脏钱从源账户转移到目的账户。银 行转账日志中只记录了自己银行中的账户的交易记录,包括从外部账户转入、 从银行账户转出和银行账户之间的转账记录。由于不太可能从每个银行得到转 账日志,因此洗钱检测问题通常集中在如何利用单个银行的转账日志上。实际 上,现有的度量和算法通常足以使用单个银行的交易记录或者来自多个银行的 联合交易记录来进行洗钱检测。下文使用“银行”来代指进行洗钱检测的银行 或者多个银行集合。一般而言,洗钱流程包括三步:a)在银行开户若干中间 账户;b)从其他银行开户的源账户转账到中间账户;c)将钱从中间账户汇集 到若干不同的目的地账户。洗钱行为具有两个主要特征,第一个特征是密集转 账。洗钱者创建了一个密集的高容量转账子图,无论是在资金流入银行还是流 出银行的时候。这是因为欺诈账户的数量有限,并且需要在短时间内将大量资 金转入银行并转出银行,从而产生了密集的高容量转账子图。第二个特征是中 间账户的账户余额基本为零。中间账户在洗钱过程中充当了资金桥的作用:大 部分流入的资金都将被转出,从而使得流入流出资金基本相等,账户余额为零。这是因为洗钱者留在中间账户中的钱会有被检测和冻结的风险。因此,欺诈者 往往在中间账户中留下尽可能少的钱。
当前对于多部稠密子图检测的方法包括:
第一是是基于规则的分类。这些规则基于本体的专家系统来检测可疑交易; 使用基于规则设计的贝叶斯网络来评估客户的交易行为的风险指数。
第二是基于机器学习算法来检测。这些方法包括SVM、决策树、RBF神经 网络等。
第三是通用的基于图的异常检测算法。这些检测方法主要基于图来检测洗 钱行为。具体包括研究特征向量中的模式,基于消息传播以及基于稠密子图等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010071390.7/2.html,转载请声明来源钻瓜专利网。