[发明专利]一种高效用序列模式挖掘方法及装置有效
申请号: | 201710261885.4 | 申请日: | 2017-04-20 |
公开(公告)号: | CN108733705B | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 林浚玮;张杰雄;陈伟;肖磊;刘婷婷 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院;腾讯科技(深圳)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 效用 序列 模式 挖掘 方法 装置 | ||
本申请公开了一种高效用序列模式挖掘方法及装置,根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合;针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;将所述效用值不低于自身所对应的效用阀值的候选序列模式,确定为挖掘结果,其中,候选序列模式对应的效用阀值为该候选序列模式所包含各项目中,效用阀值最低的项目的效用阀值,序列数据库中每一项目的效用阀值由用户预先设定。本申请可以由用户根据需要对不同项目设置不同的效用阀值,基于此从序列数据库中挖掘效用值不低于自身对应的效用阀值的序列模式,在挖掘高效用模式的基础上,能够实现个性化挖掘,满足不同应用场景的需求。
技术领域
本申请涉及数据挖掘技术领域,更具体地说,涉及一种高效用序列模式挖掘方法及装置。
背景技术
在数据挖掘技术领域中,早期比较流行的是基于支持度的模式挖掘技术,其能够在数据库中找出频繁出现的模式。著名的“啤酒和尿布”例子就是基于支持度的模式挖掘技术的应用之一。通过分析超市的销售数据,找到出现次数较多的商品组合--啤酒和尿布,将二者摆放在一起,进而提高其销售量。
但是,基于支持度的模式挖掘不能体现模式的重要性,因此基于效用的模式挖掘被提出来用于改进这个缺点。以超市的商品销售记录为例子,商品销售记录由多个顾客的购买清单组成,顾客的购买清单由购买商品组成。基于支持度的模式挖掘是为了找出在这些购买清单中出现次数较多的商品组合,这些商品具有较高的共现概率,适合放在一起,提高销售量。而基于效用的模式挖掘是找出销售额或者利润较高的商品组合,通过分析,改变销售策略,提高销售利润。将这个例子抽象成模式挖掘的模型,购买商品对应项目(item),购买清单对应事务(transaction),所有购买清单就是输入的数据库(transactionaldatabase)。如果事务由同一顾客在不同时间的所有购买清单组成(如,事务[a c],[b],[ad]表示顾客先购买商品a和商品c,再购买商品b,最后购买商品a和商品d),则包括这些事务的数据库为序列数据库。序列数据库中的每一事务,所包含的项目集合存在排序顺序。高效用序列模式挖掘算法所挖掘的是效用值高于设定效用阀值的商品组合,也就是序列模式(pattern)。序列模式是不同项目集的有序排序。
现有的高效用序列模式挖掘技术使用单一阀值衡量序列模式的价值,即针对不同的项目设置统一的效用阀值。而在实际应用中,不同的项目可能具有不同的性质,如出现概率、单位利润等,不同项目对不同用户的吸引力也不同。使用单一阀值衡量序列模式的价值无法满足不同应用场景的需求。
发明内容
有鉴于此,本申请提供了一种高效用序列模式挖掘方法及装置,用于解决现有高效用序列模式挖掘技术使用单一阀值衡量序列模式的价值无法满足不同应用场景的需求的问题。
为了实现上述目的,现提出的方案如下:
一种高效用序列模式挖掘方法,包括:
根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合,所述事务和所述候选序列模式均是由项目集合序列组成,项目集合序列包含至少一项目集合;
针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;
将所述效用值不低于自身所对应的效用阀值的候选序列模式,确定为挖掘结果,其中,候选序列模式对应的效用阀值为该候选序列模式所包含各项目中,效用阀值最低的项目的效用阀值,序列数据库中每一项目的效用阀值由用户预先设定。
一种高效用序列模式挖掘装置,包括:
候选序列模式集合获取单元,用于根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合,所述事务和所述候选序列模式均是由项目集合序列组成,项目集合序列包含至少一项目集合;
候选序列模式效用值确定单元,用于针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院;腾讯科技(深圳)有限公司,未经哈尔滨工业大学深圳研究生院;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710261885.4/2.html,转载请声明来源钻瓜专利网。