[发明专利]一种闭项集及生成子挖掘方法及装置在审

专利信息
申请号: 202010939712.5 申请日: 2020-09-08
公开(公告)号: CN112231438A 公开(公告)日: 2021-01-15
发明(设计)人: 尤涛;刘青春;孙悦;杜晓燕;杜承烈 申请(专利权)人: 西北工业大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/953
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 党娟娟;郭永丽
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 闭项集 生成 挖掘 方法 装置
【说明书】:

发明公开了一种闭项集及生成子挖掘方法及装置,涉及计算机领域。用以解决现有技术中针对不确定数据的闭项集的生成子的挖掘算法存在效率较低的问题。该方法包括:根据每个概率频繁i项集的频繁概率与其对应的子集的频繁概率,当确定有Y个概率频繁i‑1项集的频繁概率等于与其对应的超集的频繁概率时,则将X‑Y个概率频繁i‑1项集确定为闭项集;若确认第一队列中包括有任意一个K项集是为闭项集的概率频繁i‑1项集的子集时,则将K项集与为闭项集的概率频繁i‑1项集进行关联;将与为闭项集的概率频繁i‑1项集关联的K项集、X‑Y个为闭项集的概率频繁i‑1项集和Y个为非闭项集概率频繁i‑1项集添加到第i‑1层挖掘结果内。

技术领域

本发明涉及计算机领域,更具体的涉及一种闭项集及生成子挖掘方法及装置。

背景技术

随着智能设备和互联网应用的快速普及,在网络中产生、收集和传播的数据量日益激增,特别在近些年来,随着传感器网络监控、移动对象检测、目标识别等技术的广泛应用,产生了大量的不确定数据,因此在数据挖掘领域,对不确定数据的挖掘越来越被研究者们所重视。如何提高挖掘算法的性能,在更短的时间内从大量不确定数据中提取出对人们有用的信息,成为了研究者的重点研究对象。

在海量数据时代的大背景下,对数据中频繁项集的挖掘的相关研究越来越多,但是数据中频繁项集数量通常是指数级的,这降低了挖掘结果的有用性。一个非常有用的解决这一问题的方法是挖掘频繁项集中的一小部分——频繁闭项集。相比于频繁项集,频繁闭项集不仅在数量上有极大的减少,而且不破坏原来数据的完整性,因此,挖掘数据中的频繁闭项集有很高的实用性。在确定性数据集中,挖掘频繁闭项集的算法有基于广度优先增长的Apriori和基于树形结构做深度优先搜索的FP-Growth算法等。而在不确定数据集频繁闭项集的挖掘中,并没有类似的算法,因此我们考虑将这类算法进行改进来挖掘不确定数据中的频繁闭项集。由于Apriori是一个逐层迭代的算法,也就是说先处理1项集,接着处理2项集,然后处理3项集,以此类推,直到处理完数据库中可以得到的最长项集,在处理某个频繁i项集X的过程中,其真子集都是已经处理过的;在工作中,概率频繁项集是已经得到的已知数据,而且这些项集满足以下单调性质:一个项集的频繁概率不会大于其真子集的频繁概率。这个性质与Apriori的属性“一个项集的支持度小于等于其真子集的支持度”极其类似。

综上所述,现有技术中针对不确定数据的闭项集的生成子的挖掘算法存在效率较低的问题。

发明内容

本发明实施例提供一种闭项集及生成子挖掘方法及装置,用以解决现有技术中针对不确定数据的闭项集的生成子的挖掘算法存在效率较低的问题。

本发明实施例提供一种闭项集及生成子挖掘方法,包括:

从概率频繁项集中确定N个概率频繁1项集、每个所述概率频繁1项集的频繁概率和N个概率频繁1项集对应的M个概率频繁2项集;根据每个所述概率频繁2项集的频繁概率与其对应的子集的频繁概率,当确定有P个所述概率频繁1项集的频繁概率等于其对应的超集的频繁概率时,则将P个所述概率频繁1项集确定为非闭项集,并将P个为生成子及非闭项集的所述概率频繁1项集添加到第一队列中;

根据每个所述概率频繁i项集的频繁概率与其对应的子集的频繁概率,当确定有Y个所述概率频繁i-1项集的频繁概率等于与其对应的超集的频繁概率时,则将X-Y个所述概率频繁i-1项集确定为闭项集;

若确认所述第一队列中包括有任意一个K项集是为闭项集的所述概率频繁i-1项集的子集时,则将所述K项集与为闭项集的所述概率频繁i-1项集进行关联;将与为闭项集的所述概率频繁i-1项集关联的所述K项集、X-Y个为闭项集的所述概率频繁i-1项集和Y个为非闭项集所述概率频繁i-1项集添加到第i-1层挖掘结果内;其中,0M≤C(N,M),0≤P≤N,0≤Y≤X,0Ki,X为正整数,i为大于1的正整数,N为正整数。

优选地,所述当确定有P个所述概率频繁1项集的频繁概率等于其对应的超集的频繁概率时,还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010939712.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top