[发明专利]面向流数据的增量式时态频繁模式并行挖掘方法有效
申请号: | 201811292708.3 | 申请日: | 2018-11-01 |
公开(公告)号: | CN109471877B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 黄芳;赵义健;杜春修;章成源;张祖平 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 杨萍 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种面向流数据的增量式时态频繁模式并行挖掘方法,包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建。本发明在获取了当前数据集的K‑项集计数后通过历史的频繁模式树和历史次频繁模式的信息对每个频繁模式的时态频繁度进行更新计算,将更新完时态频繁度的频繁模式根据阈值分别加入到时态频繁模式集合和时态次频繁模式集合中。本发明能以最小的空间代价来保存时态频繁模式的历史信息,提高频繁模式挖掘的准确性。 | ||
搜索关键词: | 面向 数据 增量 时态 频繁 模式 并行 挖掘 方法 | ||
【主权项】:
1.一种面向流数据的增量式时态频繁模式并行挖掘方法,其特征在于:包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建;第一部分具体步骤为:初始化时态次频繁模式(SFP‑list)0为空集,时态频繁模式树(TFP‑tree)0为一个带root节点的空树;通过以下步骤对t‑1时刻的时态频繁模式集和时态次频繁模式进行更新,得到t时刻的时态次频繁模式集(SFP‑list)t和时态频繁模式集(FP‑list)t,(SFP‑list)t和(FP‑list)t中的元素形式为以模式名称为key值,以相应模式在t时刻的权重为value值的键值对:S11、输入t时刻的数据集DBt、t‑1时刻的时态次频繁模式集(SFP‑list)t‑1、t‑1时刻的时态频繁模式树(TFP‑tree)t‑1;设置时态频繁模式权重阈值θ1,时态次频繁模式权重阈值θ2,θ1>θ2>0;S12、从t时刻的数据集DBt中获取集合(K‑list)t,集合(K‑list)t中的元素形式为以K‑项集,即模式为key值,以相应K‑项集的计数为value值的键值对;S13、遍历(K‑list)t中的每一个模式Ii,对其分别进行以下操作:判断Ii是否在(TFP‑tree)t‑1中;若是,则从时态频繁模式树(TFP‑tree)t‑1中获取Ii在t‑1时刻的权重
否则判断Ii是否在(SFP‑list)t‑1中;若是,则从时态次频繁模式集(SFP‑list)t‑1中获取Ii在t‑1时刻的权重
否则说明Ii在历史中没有出现,令其在t‑1时刻的权重
计算Ii在t时刻的权重
判断是否有
若是,则形成以Ii为key值,以
为value值的键值对,并将其添加到时态频繁模式集(FP‑list)t中;否则判断是否有
若是,则形成以Ii为key值,以
为value值的键值对,并将其添加到时态次频繁模式集(SFP‑list)t中;若
则Ii不属于时态频繁模式也不属于时态次频繁模式;S14、返回t时刻的时态次频繁模式集(SFP‑list)t和t时刻的时态频繁模式集(FP‑list)t;第二部分具体步骤为:S21、输入(FP‑list)t;S22、初始化一个带root节点的空的时态频繁模式树(TFP‑tree)t;S23、对于(FP‑list)t中的每一个数据项,统计包含其的所有模式的权重之和,作为该数据项的计数;将(FP‑list)t中的所有数据项按降序排列,记为(F‑list)t;S24、对于(FP‑list)t中的每一个模式,将其中的数据项按在(F‑list)t中的次序排列,将排序后的(FP‑list)t记为
S25、遍历
中的每一个模式Ii,对其分别进行以下操作:判断(TFP‑tree)t是否包含Ii,若是则更新(TFP‑tree)t中Ii的权重,否则将Ii插入(TFP‑tree)t中,并添加其权重;S26、返回(TFP‑tree)t。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811292708.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据缓存方法及系统
- 下一篇:一种变电站远动机自动比对系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置