[发明专利]基于并行PSO的最大容错频繁项集挖掘方法有效
申请号: | 201910429541.9 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110309179B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张红梅;齐东升 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/2458;G06N3/006 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 并行 pso 最大 容错 频繁 挖掘 方法 | ||
1.基于并行PSO的最大容错频繁项集挖掘方法,其特征是,具体包括步骤如下:
步骤1、将目标事务数据库转换为对应的二进制矩阵,其中二进制矩阵的行和列分别代表目标事务数据库中的事务和项,二进制矩阵的元素值为1代表项出现在对应的事务中,二进制矩阵的元素值为0代表项没有出现在对应的事务中;
步骤2、判断转换后二进制矩阵是否为稀疏矩阵:若是稀疏矩阵,则先删除二进制矩阵中支持度小于设定最小项支持度阈值的项,再执行步骤3;若不是稀疏矩阵,则直接执行步骤3;
步骤3、初始化粒子群,包括种群中每个粒子的初始位置向量和速度向量,每个粒子初始的局部最优值,以及种群初始的全局最优值;并设置计数器用来计算种群全局最优值连续多少代保持不变;粒子群规模根据矩阵的规模可适当变化,其中每一个粒子的位置向量和速度向量均是一个长度与矩阵列数相同的二进制数组;
步骤4、对粒子群中的粒子进行并行化,得到粒子群弹性分布式数据集即RDD数据集;
步骤5、计算粒子群RDD数据集中每个粒子的适应度值,其中适应度函数是由粒子当前位置作为自变量,容错块面积作为因变量,事务数据集对应的二进制矩阵为常量组成的函数,通过将每个粒子的位置向量代入适应度函数得到对应的容错块面积为该粒子的适应度值;
步骤6、判断每个粒子的适应度值是否大于该粒子的当前局部最优值:如果是,则将该粒子的当前局部最优值更新为该粒子的适应度值;否则,保持该粒子的当前局部最优值不变;
步骤7、收集全局最优值中所有粒子的局部最优值,找出其中最大的局部最优值,并将其与粒子群的当前全局最优值比较:若最大的局部最优值大于当前全局最优值比较,则将粒子群的当前全局最优值更新为最大的局部最优值,并将计数器置0;否则,保持粒子群的当前全局最优值不变,并令计数器的计数值加1;
步骤8、判断计数器的计数值是否达到给定的计数阈值:如果达到,则输出当前全局最优值所对应的粒子的位置向量,以及该粒子的支持度,并执行步骤10;否则,执行步骤9;
步骤9、向粒子群RDD数据集的所有粒子广播当前全局最优值,粒子群RDD数据集中每个粒子基于该当前全局最优值进行位置向量和速度向量的更新;
步骤10、将当前全局最优值所对应的粒子的位置向量转换为项集的形式,并判断该粒子的支持度是否大于给定的最小支持度阈值:如果是,则该项集为目标事务数据库的最大容错频繁项集;否则,该目标事务数据库在给定的最小支持度条件下没有容错频繁项集。
2.根据权利要求1所述的基于并行PSO的最大容错频繁项集挖掘方法,其特征是,步骤1中,二进制矩阵的行代表目标事务数据库中的事务,列代表目标事务数据库中的项。
3.根据权利要求1所述的基于并行PSO的最大容错频繁项集挖掘方法,其特征是,步骤2中,项x的支持度sup(x)为:
其中,N表示的是项x在目标事务数据库出现的次数,M表示的是目标事务数据库中事务的个数。
4.根据权利要求1所述的基于并行PSO的最大容错频繁项集挖掘方法,其特征是,步骤2中,最小项支持度阈值的取值范围为(0,1)。
5.根据权利要求1所述的基于并行PSO的最大容错频繁项集挖掘方法,其特征是,步骤3中,种群中的每个粒子的位置向量和速度向量的长度均等于目标事务数据库中项的个数。
6.根据权利要求1所述的基于并行PSO的最大容错频繁项集挖掘方法,其特征是,步骤5中,粒子的适应度值为:
其中,I表示项集,Tj表示第j个事务,j=1,2,…,M,M表示事务的个数,σ表示容错度,area(I)表示项集I的面积。
7.根据权利要求1所述的基于并行PSO的最大容错频繁项集挖掘方法,其特征是,步骤10中,将当前全局最优值所对应的粒子的位置向量转换为项集的形式,即将全局最优值的位置向量中值为1所对应的项提取出来组成集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910429541.9/1.html,转载请声明来源钻瓜专利网。