[发明专利]一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法在审
申请号: | 202110777271.8 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113505156A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 何新;王子龙;陈琛 | 申请(专利权)人: | 南京荣新智能科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/242;G06F16/2453;G06F16/215;G06F16/22;G06Q30/02 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 李兴林 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 prefixspan 算法 交易 数据 频繁 序列 模式 挖掘 方法 | ||
1.一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,其特征在于,包括以下步骤:
S1)对获取的商品交易数据进行预处理,得到商品交易数据集,并存入交易序列数据库D中;
S2)扫描交易序列数据库D,对每个长度为1的单项进行计数,得到每个单项的序列支持度sup并降序排列,选出前μ项且满足最小支持度min_sup的单项作为初始前缀;
S3)采取深度优先遍历,对第一个初始前缀的位置进行计算,并保存在前缀位置信息表中,生成商品交易投影数据库;再对其进行迭代,直至无法生成新的商品交易投影数据库,保存每个商品交易投影数据库生成的频繁序列模式集合;
S4)从第二个初始前缀开始,重复步骤S3),直至所有初始前缀均计算完毕;
其中,所述步骤S4)具体包括:
S401)生成第二个初始前缀的商品交易投影数据库;如果该商品交易投影数据库为空,则递归返回;
S402)扫描商品交易投影数据库,对单项进行计数;如果所有单项的序列支持度sup都低于最小支持度min_sup,则递归返回;
S403)将满足最小支持度min_sup的各个单项和当前的前缀进行合并,得到若干新的前缀,并计算新前缀的前缀位置;若前缀位置信息表存在与之前前缀位置相等的前缀,则直接返回前缀位置信息表中前缀所产生的频繁序列模式集合,并返回步骤S3);否则,前缀位置信息表保存新的前缀位置信息,并生成新的商品交易投影数据,返回步骤S401)。
2.根据权利要求1所述的基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,其特征在于,步骤S1)中所述对获取的商品交易数据进行预处理包括对缺失或重复出现的订单记录进行补全或删除,以及对出现记录错误的数据进行修正。
3.根据权利要求1所述的基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,其特征在于,步骤S2)中所述前μ项为有效项数,指售货机销售的主要商品的种类。
4.根据权利要求3所述的基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,其特征在于,所述有效项数μ根据售货机的机械结构和货柜容量以及货道数量来设定,或由管理者设定的主要商品种类数量来设定,或根据这两者的综合进行设定。
5.根据权利要求1所述的基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,其特征在于,步骤S3)中所述前缀位置信息表通过Hash表保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京荣新智能科技有限公司,未经南京荣新智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110777271.8/1.html,转载请声明来源钻瓜专利网。