[发明专利]一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法在审

专利信息
申请号: 202110777271.8 申请日: 2021-07-09
公开(公告)号: CN113505156A 公开(公告)日: 2021-10-15
发明(设计)人: 何新;王子龙;陈琛 申请(专利权)人: 南京荣新智能科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/242;G06F16/2453;G06F16/215;G06F16/22;G06Q30/02
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 李兴林
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 prefixspan 算法 交易 数据 频繁 序列 模式 挖掘 方法
【说明书】:

发明公开了一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,包括步骤:对商品交易数据进行预处理,得到商品交易数据集,并存入交易序列数据库中;扫描交易序列数据库,对每个单项进行计数,得到每个单项的序列支持度并降序排列,选出前μ项且满足最小支持度的单项作为初始前缀;采取深度优先遍历,对第一个初始前缀的位置进行计算,并保存在前缀位置信息表中,生成商品交易投影数据库;再对其进行迭代,直至无法生成新的商品交易投影数据库,保存每个商品交易投影数据库生成的频繁序列模式集合;从第二个初始前缀开始,重复上一步骤,直至所有初始前缀均计算完毕。本发明用于减少交易数据频繁序列模式挖掘的时间/空间消耗,提高执行效率。

技术领域

本发明涉及交易数据挖掘技术领域,特别是涉及一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法。

背景技术

大型连锁超市的交易数据有一系列的用户事务数据库,每一条记录包括用户的ID,事务发生的时间和事务涉及的项目,如果能在其中挖掘涉及事务间关联关系的模式,即用户几次购买行为间的联系,可以采取更有针对性的营销措施。

目前,在交易数据频繁序列模式挖掘算法中,各专家、学者花费了大量的时间和精力提出了不少典型的方法,如GSP、SPADE、PrefixSpan算法等。其中,GSP算法减少了需要扫描候选序列的数量和多余无用模式的产生,但针对大规模序列数据库会产生大量的候选序列模式,且需要对序列数据库进行循环扫描;SPADE算法扫描数据库次数降低仅为3次,但在原始数据巨大的情况下会产生大量垂直数据库;PrefixSpan算法的优点是不用产生候选序列,相比于其它两种算法,其内存消耗相对稳定,而且效率更高,但其可能会出现重复投影数据库问题,从而导致对重复的投影数据库进行挖掘划分,造成一定的重复计算,增大了时间/空间消耗。因此,一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法亟待研究。

发明内容

本发明的目的是提供一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,用于减少交易数据频繁序列模式挖掘的时间/空间消耗,提高执行效率。

为实现上述目的,本发明提供了如下方案:

一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,包括以下步骤:

S1)对获取的商品交易数据进行预处理,得到商品交易数据集,并存入交易序列数据库D中;

S2)扫描交易序列数据库D,对每个长度为1的单项进行计数,得到每个单项的序列支持度sup并降序排列,选出前μ项且满足最小支持度min_sup的单项作为初始前缀;

S3)采取深度优先遍历,对第一个初始前缀的位置进行计算,并保存在前缀位置信息表中,生成商品交易投影数据库;再对其进行迭代,直至无法生成新的商品交易投影数据库,保存每个商品交易投影数据库生成的频繁序列模式集合;

S4)从第二个初始前缀开始,重复步骤S3),直至所有初始前缀均计算完毕;

其中,所述步骤S4)具体包括:

S401)生成第二个初始前缀的商品交易投影数据库;如果该商品交易投影数据库为空,则递归返回;

S402)扫描商品交易投影数据库,对单项进行计数;如果所有单项的序列支持度sup都低于最小支持度min_sup,则递归返回;

S403)将满足最小支持度min_sup的各个单项和当前的前缀进行合并,得到若干新的前缀,并计算新前缀的前缀位置;若前缀位置信息表存在与之前前缀位置相等的前缀,则直接返回前缀位置信息表中前缀所产生的频繁序列模式集合,并返回步骤S3);否则,前缀位置信息表保存新的前缀位置信息,并生成新的商品交易投影数据,返回步骤S401)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京荣新智能科技有限公司,未经南京荣新智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110777271.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top