[发明专利]基于频繁和占有特征的skyline模式挖掘方法及装置在审

专利信息
申请号: 202010655913.2 申请日: 2020-07-09
公开(公告)号: CN111930798A 公开(公告)日: 2020-11-13
发明(设计)人: 尤涛;胡焜;刘青春;杜承烈;贺睿瞢 申请(专利权)人: 西北工业大学
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 郭永丽;党娟娟
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 频繁 占有 特征 skyline 模式 挖掘 方法 装置
【权利要求书】:

1.一种基于频繁和占有特征的skyline模式挖掘方法,其特征在于,所述方法包括:

获取包括至少一件事务的事务数据集,每件事务中包括至少一个单项;

对所述事务数据集中包括的所有单项进行统计,获取各所述单项在所述事务数据集中的频繁度;

根据各所述单项的频繁度,按照降序方式对各所述单项的PEL数据结构进行排序;

根据广度优先遍历方法,逐层遍历根据排序后的各所述单项的PEL数据结构形成的当前模式以及由所述当前模式扩展得到的扩展模式,从所述当前模式以及所述当前模式的扩展模式中挖掘出满足预设挖掘条件的skyline模式。

2.根据权利要求1所述的方法,其特征在于,所述根据广度优先遍历方法,逐层遍历根据各所述单项的PEL数据结构形成的当前模式以及以所述当前模式扩展得到的扩展模式,从所述当前模式以及所述当前模式的扩展模式中挖掘出满足预设挖掘条件的skyline模式包括:

按照排序后的各所述单项的PEL数据结构,分别对应形成各当前模式以及由所述当前模式扩展得到的扩展模式;依次判断各所述当前模式是否满足预设挖掘条件;

若是,则确定所述当前模式为满足预设挖掘条件的skyline模式,保留所述当前模式并根据预设剪枝条件对所述当前模式的扩展模式进行剪枝;

依次判断所述当前模式的扩展模式是否满足预设挖掘条件;

若是,则确定所述当前模式的扩展模式为满足预设挖掘条件的skyline模式,保留所述当前模式的扩展模式。

3.根据权利要求2所述的方法,其特征在于,所述依次判断各所述当前模式是否满足预设挖掘条件包括:

根据排序后的各所述单项的PEL数据结构,获取各所述当前模式的频繁度、扩展前景值和占有特征值;

按顺序依次判断所述当前模式的频繁度是否大于等于预设最小频繁度;

若是,则判断所述当前模式的占有特征值是否大于等于当前频繁度对应的初始的最大占有特征值;

若是,则确定所述当前模式满足预设挖掘条件,并将所述当前模式的占有特征值作为当前频繁度以及小于当前频繁度的其余频繁度对应的最大占有特征值,继续执行按顺序依次判断所述当前模式的频繁度是否大于等于预设最小频繁度的步骤。

4.根据权利要求3所述的方法,其特征在于,所述扩展前景值根据如下公式计算得到:

其中,ExValue(X)为模式X的扩展前景值,|item_length|为模式X的长度,Dx为事务数据集中包含模式X的事务形成的支持数据集,|Dx|为Dx中包含的事务数量,为Dx中包括的事务的长度之和,id为事务在事务数据集中的编号,Surplusid为模式X在Dx中包括的各事务中的后继模式数,Surplusid为模式X在Dx中包括的各事务中的后继模式数之和。

5.根据权利要求3所述的方法,其特征在于,所述占有特征值根据如下公式计算得到:

其中,occu(X)为模式X的占有特征值,sup_count为模式X的频繁度,为模式X的长度与Dx中包括的各事务的长度的比值之和。

6.根据权利要求5所述的方法,其特征在于,所述最大占有特征值根据如下公式计算得到:

occumax[count]=Max{occu(X)|sup_count(X)≥count},

其中,occumax[count]为模式X的频繁度为count时对应的最大占有特征值。

7.根据权利要求3所述的方法,其特征在于,所述保留所述当前模式并根据预设剪枝条件对所述当前模式的扩展模式进行剪枝包括:

判断所述当前模式的扩展前景值是否小于当前频繁度对应的最大占有特征值;

若是,则剪掉所述当前模式扩展得到的扩展模式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010655913.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top