[发明专利]一种用于经济犯罪侦察分析的图数据库匹配方法及装置在审
申请号: | 201611175367.2 | 申请日: | 2016-12-19 |
公开(公告)号: | CN108205552A | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 胡国超;聂琨琳;李程 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中间结果 投影表 侦察 条边 匹配 数据库 集合 广度优先搜索 深度优先搜索 缓冲区 准确度 办案效率 策略结合 交易数据 可疑交易 模式匹配 图形网络 数据图 写入 分析 取出 转入 查询 记录 帮助 发现 | ||
本发明提供一种用于经济犯罪侦察分析的图数据库匹配方法及装置,所述方法包括确定查询图q到数据图库g的每一条边的边投影表ep1,ep2,...,epn,构成边投影表集合{ep1,ep2,...,epn};判断投影表epn是否为空,如果不为空,则将边投影表集合{ep1,ep2,...,epn}依次从1到n逐条取出记录写入中间结果缓冲区rcn,直至rcn写满并转入中间结果处理步骤。本发明采用广度优先搜索策略与深度优先搜索策略结合,采用不是每得到一个中间结果就前进,而是一次计算出n条中间结果,对这n条中间结果一起进行下一条边的扩展。本发明提供解决经济侦察中海量涉经济类交易数据组成的图形网络的模式匹配问题,用于帮助经侦办案人员发现可疑交易模式、行为,提高办案效率与准确度。
技术领域
本发明涉及一种用于经济犯罪侦察分析的图数据库匹配方法及装置,属于图数据库分析技术领域。
背景技术
大数据时代,金融行业每年产生的数据量非常惊人。据不完全统计,目前中国大型商业银行和证券公司的数据量已经达到1000TB以上,来自交易、日志、事件、邮件的内部数据虽然仍占大比例,随着互联网金融来袭,金融业也需要利用网络的数据,来自社交媒体、传感器、地理信息、音视频等信息也不可小觑。经济领域的数据每天产生的数据量是巨大的,对于现有的关系型数据库来说:在一张包含海量数据的表中查询,效率是非常低的;用户搜查查询的并发性非常高,对于硬盘I/O是一个很大的瓶颈;对数据库的升级和扩展是非常有难度的,往往需要停机维护和数据迁移;对数据的存储要求非常高,必须严格遵守格式化要求。以银行为例,每年产生结构化数据已超过5PB,非结构化数据超过15PB,每一个网上支付业务,仅仅记录用户网上行为的数据量就超过1个GB,在海量商业银行、证券公司的交易数据之中隐藏了数量不菲的经济犯罪线索。目前,就经济犯罪领域,数据存储模式还是基于结构化数据存储模式,存储在关系型数据库中(例如:Oracle、Microsoft SQL Server、MySQL、浪潮K-DB等),搜索匹配模式还是单一的链式匹配,对于数量庞大且非结构化的金融数据无法实现有效处理,会有宕机等情况出现。
因此随着信息技术的发展,越来越多的复杂数据超出了传统的关系型数据库的能力范围,图就是这些复杂数据中的一种。图可以很好的表达类似社会网络、实体复杂关联等事物的语义。图数据库以及基于图的模式匹配在大数据的处理上具备了高效性、并发性、扩展性和可用性等优势,因此本专利主要关注和讨论如何在大规模的图数据库上高效地进行模式匹配查询,目的在于解决经济侦察中海量涉经济类交易数据组成的图形网络的模式匹配问题,用于帮助经侦办案人员发现可疑交易模式、行为。
图数据库上的模式匹配的核心问题是子图同构问题,目前提出的子图同构算法都是回溯搜索法,即尝试把查询图在数据图上逐步扩展,如果成功就继续向前扩展,如果失败就会退到前一步继续尝试其他的搜索路径。此外,数据库的庞大规模也是另一个挑战,一个图数据库可能保存着一张规模巨大的图,或者数量庞大的小规模图,对于后一种类型的图数据库,已经有了较好的解决方案,如:采用“过滤-验证”框架,在减少子图同构检测次数的情况下,完成所有模式匹配。
上述方法针对第二种图数据库是较好的解决方案,但是针对第一类图数据库则无能为力,原因在于上述算法需要在内存中进行,而第一类图数据库往往规模庞大,一般不能把其完全装载到内存中。第一类图数据库往往具有更大的应用价值,它们在图数据的存储管理上取得了很大的成功,但目前,对于复杂的模式匹配查询支持并不理想。本专利的研究主要针对大规模图数据库上的复杂模式匹配问题。
发明内容
本发明的目的在于克服现有技术不足,提供了一种用于经济犯罪侦察分析的图数据库匹配方法及装置。
本发明的技术解决方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611175367.2/2.html,转载请声明来源钻瓜专利网。