[发明专利]一种图数据库中稠密子图挖掘方法和框架在审
申请号: | 202111025046.5 | 申请日: | 2021-09-02 |
公开(公告)号: | CN113761247A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 黄园园;苏俊;郭海城;张帆;王心同 | 申请(专利权)人: | 积至(广州)信息技术有限公司 |
主分类号: | G06F16/538 | 分类号: | G06F16/538;G06F16/583 |
代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 李立 |
地址: | 510555 广东省广州市黄浦区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 稠密 挖掘 方法 框架 | ||
本发明提供一种图数据库中稠密子图挖掘方法,所述图数据库中稠密子图挖掘方法在现有truss分解算法的基础上,利用cmax‑core中一定存在一个(cmax‑2)‑truss这一性质来找到一个候选子图,并在候选子图中truss分解;所述图数据库中稠密子图挖掘方法具体包括以下步骤:S1:在全图上进行core分解找到cmax‑core;S2:在子图cmax‑core中进行truss分解来得到最大的truss值;S3:令klower bound为此子图中的最大truss值;S4:在子图(klower bound‑1)‑core中进行truss分解得到kmax‑truss。本发明提供的图数据库中稠密子图挖掘方法和框架,充分利用了truss的特点,缩小了候选图的大小,在细节上改进了邻居表的存储方式以及三角形的计数方法,在多个数据集中,本方法比现有算法快一到两个数量级。
技术领域
本发明涉及图数据库中稠密子图挖掘方法领域,尤其涉及一种图数据库中稠密子图挖掘方法和框架。
背景技术
随着计算机硬件的发展以及数据总量的增加,数据挖掘算法在许多领域都得到了应用。而在这些庞大且复杂的数据中,有相当一部分可以以图的形式自然的呈现出来。这些图往往都展现出一种类似社群的基础结构。社群是一种稠密的,由连接紧密的节点构成的子图,k-truss作为社群的一种表现形式,在如在社群搜索,角色识别,垃圾邮件检测等领域中得到了广泛的应用。
其中,kmax-truss代表着最为稠密的子图。找到它,也就找到了联系最紧密的社群,在子图k-truss中,每条边都至少在k个三角形中,而kmax-truss即为所有k-truss中k最大的那一个子图。
目前寻找kmax-truss的方法为使用truss分解找出图中所有的truss,其中包括所需的kmax-truss以及其他所有k值小于kmax的truss。这个算法从全图开始,通过依次将边归入n-class,把图分割为了一个金字塔型的结构。每一条边都属于一个n-class。而k-truss则为即所有大于k的class的并集。对于truss分解问题的解决方案已经较为成熟,它充分利用了CPU与GPU的并行能力来加速计算1。
同时truss分解中涉及三角形计数问题,目前最先进的算法2,首先将无向图转换为有向图,这样可以使每个三角形只会被遍历一次,然后在具体遍历每个顶点时,需要分别遍历他的传出和传入邻居尽管在truss分解上现有技术已经较为成熟了,但是对于寻找kmax-truss,它并没有针对性的优化。
现有计算kmax-truss方法的不足之处在于它是从全图开始依次计算每一个n-class。通常情况下,全图与的kmax-truss子图的大小之比大于100:1。从全图开始计算使得计算时间大大增加。
且目前最成熟的三角形计数方法,需要分别遍历每个顶点的传入和传出邻居,十分麻烦。
因此,有必要提供一种图数据库中稠密子图挖掘方法和框架解决上述技术问题。
发明内容
本发明提供一种图数据库中稠密子图挖掘方法和框架,解决了在图数据库中挖掘稠密社群,即kmax-truss子图,极其耗时的问题。
为解决上述技术问题,本发明提供的图数据库中稠密子图挖掘方法,所述图数据库中稠密子图挖掘方法在现有truss分解算法的基础上,利用cmax-core中一定存在一个(cmax-2)-truss这一性质来找到一个候选子图,并在候选子图中truss分解;
所述图数据库中稠密子图挖掘方法具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于积至(广州)信息技术有限公司,未经积至(广州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111025046.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全自动包边分切机及包边分切方法
- 下一篇:一种新外轮廓轮胎的配方及其制备工艺