[发明专利]一种分布式环境下图模式关联规则挖掘方法有效
申请号: | 201810448459.6 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108595711B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 王欣;徐杨;贾建民 | 申请(专利权)人: | 西南石油大学;成都华数天成科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/901;G06Q50/00 |
代理公司: | 成都信博专利代理有限责任公司 51200 | 代理人: | 舒启龙 |
地址: | 610599 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分布式环境下图模式关联规则挖掘方法,搭建分布式计算环境,整个分布式环境包括一个中心与多个分区;设定挖掘的支持度及置信度阈值,统计全局频繁单边;分区统计结果将发送至中心进行汇总,确定频繁边集合;进行频繁结构挖掘;中心将从频繁单边开始,对其进行right‑most路径上的迭代生长,每一轮生长结果将被广播至所有分区进行挖掘,挖掘结果反馈至中心;中心汇总统计后去除不满足支持度阈值的结构,对满足支持度阈值的结构,继续进行迭代生长,直至所有频繁单边结构迭代完成,输出编码树;最后产生图结构关联规则。本发明为用户提供了在大规模社交网络中挖掘图模式关联规则,并利用图模式关联规则开展社交营销和推荐的技术。 | ||
搜索关键词: | 一种 分布式 环境 下图 模式 关联 规则 挖掘 方法 | ||
【主权项】:
1.一种分布式环境下图模式关联规则挖掘方法,其特征在于,包括以下步骤:S1:构建分布式环境下编码树:S11:建立由一个中心站点和多个分区站点组成的支持半双工通信和多线程计算的分布式计算框架,并根据分布式计算框架建立各站点之间的路由表;S12:设定挖掘支持度及置信度阈值;S13:全局频繁单边统计;S14:全局增量频繁模式挖掘;S15:依据在增量频繁模式的挖掘过程中所维护的模式生长过程,从单边频繁模式开始,自上而下的生长出其“孩子”节点,直至该单边频繁模式的最大频繁模式,构建编码树;S2:生成基于编码树的图模式关联规则:S21:确定最大频繁模式集合,即编码树叶子节点集合;S22:从编码树的叶子节点开始,对编码树进行逆向广度优先搜索;S23:对于搜索访问到的节点,建立图模式关联规则;S24:对关联规则进行置信度检验,若满足置信度检验,则是一个有效的图模式关联规则。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;成都华数天成科技有限公司,未经西南石油大学;成都华数天成科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810448459.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种快速的海量图片去重方法
- 下一篇:对象特征参数的处理方法、装置和电子设备