[发明专利]基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法有效
申请号: | 201911049403.4 | 申请日: | 2019-10-31 |
公开(公告)号: | CN111125182B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 叶志伟;董达伟;曹羽 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/006 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 优化 算法 频繁 模式 增长 关联 规则 提取 方法 | ||
1.一种基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法,其特征在于,包括以下步骤:
步骤1:输入事务数据集,从文件中读取出事务数据,每项事务按字符串的形式逐条保存于事务列表结构中;
步骤2:针对读取到的事务数据集,利用频繁模式增长算法构建该事务数据集的频繁模式树;
步骤3:利用已构建好的频繁模式树创建对应的头表;
步骤4:遍历已创建好的头表,对头表中的每一项,在频繁模式树中搜索利用蚁狮算法生成的该项条件模式基子集,计算该项条件模式基子集与该项构成的关联规则的适应度;
其中,遍历频繁模式树找到该项的条件模式基,然后以二进制随机表示条件模式基中的每一项是否被选中,选中则为1,未选中则为0;将条件模式基中所有被选中的项组合在一起作为当前关联规则的左部,即该项条件模式基子集;
其中,适应度评价函数为:
其中,support和confidence分别为当前选定关联规则计算出的支持度和置信度,minsup和minconf为预设的最小支持度和最小置信度;
其中,lrsum为左右部同时出现的事务数,sum为总事务数,supnum为左部的支持数,然后将关联规则及其对应的适应度保存至列表中;
适应度评估完以后保存关联规则,将搜索到的关联规则适应度大于1的规则进行保存,即置信度与支持度之和大于最小置信度与最小支持度之和,只保留不重复的关联规则;
步骤5:输出所有搜索到的关联规则。
2.根据权利要求1所述的基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法,其特征在于:步骤1中,每项事务按字符串的形式逐条保存于事务列表结构中,每行表示一个事务,按相同格式存放。
3.根据权利要求1所述的基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法,其特征在于:步骤2中,根据最小支持度对事务列表进行遍历生成该事务数据集的频繁模式树。
4.根据权利要求1-3任意一项所述的基于改进蚁狮优化算法和频繁模式增长的关联规则提取方法,其特征在于:步骤4中,利用蚁狮算法生成该项条件模式基子集,具体实现包括以下子步骤:
步骤4.1:读入事务数据,利用频繁模式增长算法生成频繁模式树,将频繁模式树和所有路径作为参数传给蚁狮算法,初始化蚁狮算法所需参数,参数包括:种群大小size、解空间上边界ub、解空间下边界lb、进化代数gen、关联规则指定项、头表size和根节点;
步骤4.2:蚁狮算法种群初始位置随机生成,生成规则为:
关联规则的挖掘过程遍历项头表对头表中的项逐项挖掘,对于选定项根据步骤4.1中传入的条件模式基随机选取条件模式基中的项生成路径,选取的用1表示,未选取的用0表示,将头表中的项作为终节点进行关联规则适应度评估,得到初始种群;
步骤4.3:用轮盘选赌法随机选取种群个体;
步骤4.4:更新种群位置,按蚁狮优化算法的随机游走策略让蚂蚁绕该个体进行游走,随机游走过程为:
步骤4.4.1:调整选定蚁狮上下界范围,调整公式如下:
其中,u(k)和l(k)分别调整上界和下界,其中k为对应维度,u(k)和l(k)分别表示第k个维度的上边界和下边界,I的计算公式为:
其中,T和t分别表示总进化迭代次数和当前迭代次数,w为参数;
当0.5T≥t0.1T时,w取值2;0.75T≥t0.5T时,w取值3;0.9T≥t0.75T时,w取值4;0.95T≥t0.9T时,w取值5;当t0.95T时,w取值6;
步骤4.4.2:随机游走,随机生成一个蚂蚁绕选定蚁狮游走总迭代次数次得到该蚂蚁空间位置,并对该位置进行最大最小归一化处理,随机游走和归一化公式如下:
C(X)=[cumsum(2r(t1)-1),…,cumsum(2r(tmax)-1)];
其中,cumsum()函数求累加和,r()函数为满足正态分布的随机函数,随机选取蚂蚁在该维度上的游走方向,取得0和1的概率相同;
步骤4.4.3:返回该蚂蚁;
步骤4.5:选取精英蚁狮与步骤4.4相同生成绕精英蚁狮游走的蚂蚁;
步骤4.6:按蚁狮优化算法的均值更新策略计算上述两个蚂蚁位置均值替换该种群对应蚁狮位置,种群遍历完后将越界蚁狮位置映射成边界值替代;
步骤4.7:判断是否满足终止条件;其中终止条件是预设的最大运行迭代次数;
若是,结束搜索过程,进入步骤5;
若否,则回转执行所述步骤4.3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911049403.4/1.html,转载请声明来源钻瓜专利网。