[发明专利]基于时序向量差异序列法聚类的周期关联规则发现算法无效
申请号: | 200610052952.3 | 申请日: | 2006-08-15 |
公开(公告)号: | CN101127037A | 公开(公告)日: | 2008-02-20 |
发明(设计)人: | 曾斌;曾凯;姜小丽;王宇熙 | 申请(专利权)人: | 临安微创网格信息工程有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 311300浙江省临*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时序 向量 差异 序列 法聚类 周期 关联 规则 发现 算法 | ||
1.一种基于时序向量差异序列法聚类的周期关联规则发现算法(CARDSATSV),CARDSATSV由两部分组成:CMDSA和CFP-tree。首先CMDSA对由项目支持度组成的时序向量采用基于差异序列法和DB Index准则的聚类来动态的确定周期内的关联规则的各个时间区域,用DB Index准则来控制聚类个数以达到最佳的聚类效果。CFP-tree采用基于条件FP树的周期性剪裁技术对周期中各个时间区域上的事务数据库进行周期性关联规则的发现。
2.根据权利要求1所述的CMDSA算法,其特征在于CMDSA基于差异序列法和DB Index准则对时序向量进行聚类。差异序列法只是分类无法判断分多少类达到最佳分类,所以还需DB INDEX准则来判断最佳分类数。CMDSA结合两者来对第一周期的时序向量序列E进行聚类,确定时域数据特征点的分布规律,进而确定周期内的关联规则的各个时间区域。
3.根据权利要求1所述的CFP-tree算法,其特征在于在第一个周期的各个时间段构造FP-tree树,从周期频繁项目列表L出发,采用基于条件FP-tree的周期性剪裁技术生成所有周期频繁项目集,进而发现所有强周期关联规则。
4.根据权利要求1、3所述的在第一个周期的各个时间段构造FP-tree树,其特征在于在第一个周期的每一个时间段[si,ei]中事务数据库Di中构造FP-treei具体步骤:1)扫描1次事务数据库Di,产生频繁项目集合Fi及其相应支持度,将Fi和除开第一周期的所有周期中的对应时间段[si,ei]的事务数据库Di的所有事务进行比对得到周期频繁项目集合F(F里面的每一个项目x形成的1-项集都是周期频繁项目集)和x相应的周期性支持度。以x的周期性支持度降序排列F,生成周期频繁项目列表Li;其中F中的项目rti表示F中的项目x在第t个周期的第i个时间段[si,ei]区域内包含x的事务数目与时间段[si,ei]区域内中所有事务数目的比值。在所有n个周期的第i个时间段[si,ei]中,有x的周期性支持度s=min{r1i,r2i,...,rni}。2)创建FP-treei的根节点,以“null”标记。对Di中的每一个事务t做如下处理:按周期频繁项目列表L选择t中频繁项目,删除非频繁项目,按L中元素出现次序排列事务t中频繁元素排过序的频繁元素列表做标记[p|P],p是第1个元素,P是剩余元素的列表然后调用insert tree([p|P],T)。其中,函数insert tree([p|P],T)处理过程为:如果T有子结点N,且N.item_name=P.item_name,则使N计数加1;否则,创建新结点N,计数为1,其父结点为T,结点链接到与其名称相同的下一个结点。如果P非空,再递归调用insert tree(P,N)。
5.根据权利要求1、3所述基于条件FP-tree的周期性剪裁技术,其特征在于对FP-growth的改进,增加FP-growth发现周期频繁项目集的功能。CFP-growth对FP-growth中的模式β的条件FP-tree进行周期性剪裁。也就是将模式β和β的条件FP-tree形成的集合(例如β为{kma},β的条件FP-tree为{(f:3,b:3)}|kma,则形成的集合{{fkam},{bkam}})和其他周期的对应时间分段[sj,ej]中所有事务进行比对,剪裁掉集合中周期性支持度小于smin的项目集,生成模式β的周期性条件FP-tree。在第一周期每一个时间分段[sj,ej]的FP-tree遍历完成时,即生成所有周期频繁项目集。
6.据权利要求1、3所述发现所有强周期关联规则,其特征在于每个周期的每一个时间段[si,ei]中的强周期关联规则可用该时间段中找到的所有周期频繁项目集直接产生。具体为即对每一个周期频繁项目集L的所有非空的子集合a,若support(L)/support(a)>=cmin,则有强周期关联规则a→(L-a)[C,si,ei,sa→(L-a),ca→(L-a)]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于临安微创网格信息工程有限公司,未经临安微创网格信息工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610052952.3/1.html,转载请声明来源钻瓜专利网。