[发明专利]面向流数据的增量式时态频繁模式并行挖掘方法有效

专利信息
申请号: 201811292708.3 申请日: 2018-11-01
公开(公告)号: CN109471877B 公开(公告)日: 2022-04-22
发明(设计)人: 黄芳;赵义健;杜春修;章成源;张祖平 申请(专利权)人: 中南大学
主分类号: G06F16/2455 分类号: G06F16/2455;G06F16/2458
代理公司: 长沙市融智专利事务所(普通合伙) 43114 代理人: 杨萍
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种面向流数据的增量式时态频繁模式并行挖掘方法,包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建。本发明在获取了当前数据集的K‑项集计数后通过历史的频繁模式树和历史次频繁模式的信息对每个频繁模式的时态频繁度进行更新计算,将更新完时态频繁度的频繁模式根据阈值分别加入到时态频繁模式集合和时态次频繁模式集合中。本发明能以最小的空间代价来保存时态频繁模式的历史信息,提高频繁模式挖掘的准确性。
搜索关键词: 面向 数据 增量 时态 频繁 模式 并行 挖掘 方法
【主权项】:
1.一种面向流数据的增量式时态频繁模式并行挖掘方法,其特征在于:包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建;第一部分具体步骤为:初始化时态次频繁模式(SFP‑list)0为空集,时态频繁模式树(TFP‑tree)0为一个带root节点的空树;通过以下步骤对t‑1时刻的时态频繁模式集和时态次频繁模式进行更新,得到t时刻的时态次频繁模式集(SFP‑list)t和时态频繁模式集(FP‑list)t,(SFP‑list)t和(FP‑list)t中的元素形式为以模式名称为key值,以相应模式在t时刻的权重为value值的键值对:S11、输入t时刻的数据集DBt、t‑1时刻的时态次频繁模式集(SFP‑list)t‑1、t‑1时刻的时态频繁模式树(TFP‑tree)t‑1;设置时态频繁模式权重阈值θ1,时态次频繁模式权重阈值θ2,θ1>θ2>0;S12、从t时刻的数据集DBt中获取集合(K‑list)t,集合(K‑list)t中的元素形式为以K‑项集,即模式为key值,以相应K‑项集的计数为value值的键值对;S13、遍历(K‑list)t中的每一个模式Ii,对其分别进行以下操作:判断Ii是否在(TFP‑tree)t‑1中;若是,则从时态频繁模式树(TFP‑tree)t‑1中获取Ii在t‑1时刻的权重否则判断Ii是否在(SFP‑list)t‑1中;若是,则从时态次频繁模式集(SFP‑list)t‑1中获取Ii在t‑1时刻的权重否则说明Ii在历史中没有出现,令其在t‑1时刻的权重计算Ii在t时刻的权重判断是否有若是,则形成以Ii为key值,以为value值的键值对,并将其添加到时态频繁模式集(FP‑list)t中;否则判断是否有若是,则形成以Ii为key值,以为value值的键值对,并将其添加到时态次频繁模式集(SFP‑list)t中;若则Ii不属于时态频繁模式也不属于时态次频繁模式;S14、返回t时刻的时态次频繁模式集(SFP‑list)t和t时刻的时态频繁模式集(FP‑list)t;第二部分具体步骤为:S21、输入(FP‑list)t;S22、初始化一个带root节点的空的时态频繁模式树(TFP‑tree)t;S23、对于(FP‑list)t中的每一个数据项,统计包含其的所有模式的权重之和,作为该数据项的计数;将(FP‑list)t中的所有数据项按降序排列,记为(F‑list)t;S24、对于(FP‑list)t中的每一个模式,将其中的数据项按在(F‑list)t中的次序排列,将排序后的(FP‑list)t记为S25、遍历中的每一个模式Ii,对其分别进行以下操作:判断(TFP‑tree)t是否包含Ii,若是则更新(TFP‑tree)t中Ii的权重,否则将Ii插入(TFP‑tree)t中,并添加其权重;S26、返回(TFP‑tree)t。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811292708.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top