[发明专利]二次相关判定法选取有效的负关联规则在客户购买行为分析中的应用在审
申请号: | 201510963625.2 | 申请日: | 2015-12-18 |
公开(公告)号: | CN105608602A | 公开(公告)日: | 2016-05-25 |
发明(设计)人: | 董祥军;宫永顺;李晨露 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250353 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二次 相关 判定 选取 有效 关联 规则 客户 购买 行为 分析 中的 应用 | ||
技术领域
本发明涉及二次相关判定法选取有效的负关联规则在客户购买行为分析中的应 用,属于负关联规则的应用技术领域。
背景技术
目前,超市购物已经成为每个家庭生活中必不可少的一环,而客户在商品购买的 过程中存在着大量商品之间的关联。有一个有趣的例子:一家超市将牛奶和储物箱一起捆 绑出售。这个不易被人理解的销售方法却使得牛奶和储物箱的销量比原来单列销售增多 了。这是一家在中国知名度颇高的连锁店的案例,此超市拥有非常大的数据仓库存储系统, 存储系统记录了每一个顾客的每一笔交易的详细记录,并且以会员卡的形式记录下了购物 的详细信息。为了能够准确了解顾客们的购物惯例,此超市对所有顾客的购物记录进行分 析,想通过已经存储的数据来了解使用了会员卡的这些顾客经常将哪些商品一并购买。研 究人员在这些历史交易数据的基础上,利用关联规则挖掘方法对这些交易数据集进行分 析、整合、挖掘,并发现了一个让人不容易理解的销售关联:与储物箱一起购买最多的商品 竟然是牛奶!经过大量实际调查和分析,揭示了一个隐藏购物模式:在中国区域,到超市去 购买了牛奶的顾客其中有30%~40%的人同时也为自己购买了储物箱。
一般来看,牛奶与储物箱毫无联系,如果研究人员不是借助历史记录进行关联规 则挖掘分析,超市将会错失掉如此有价值的规律。因此,从大型超市数据库中可以发现一些 潜在的、有用的、有价值的信息,并应用于超级市场的经营。通过对所积累的销售数据的分 析,可以得出各种商品的销售信息。从而更合理地制定各种商品的定货情况,对各种商品的 库存进行合理地控制。另外,根据各种商品销售的相关情况,可分析商品的销售关联性,从 而可以进行商品的货篮分析和组合管理,以更加有利于商品销售。
数据关联是为了找出大量数据项集之间有趣的相关联系,应用在客户购买行为分 析中,就是为了找到客户一次购买的商品间是否存在潜在的联系。但在应用关联规则分析 客户购买行为,解决个性化商品推荐问题时,“牛奶—储物箱”的例子仅仅考虑了已发生的 事件,也称为正关联规则挖掘。
与传统的正关联规则模式不同,负关联规则模式挖掘不仅考虑了已经发生的事件,还关注于未发生事件,它能够更深入地分析和理解数据中的潜在含义,从而挖掘出容易被人们忽略但是非常有价值的信息。例如,一个超市商品陈列问题,对于被购买频率很高的三个物品A、B、C,如果A很少跟B、C同时发生,B、C就应当尽可能的摆在距离与A有相关关系的商品远的地方,利用负关联规则表示为:这样,客户可以尽量的一站式购物,不再用费心思再去寻找自己想购买的其他商品,提高了服务商的心里认同感和销售额。如今负关联规则模式的价值越来越被人们认可,在深入理解和处理许多商业应用方面,如对客户购买行为分析方面,它更有一种不可替代的作用。
但是,在含负项的负关联模式的挖掘过程中,有时会出现形如与a=>bc的两组负关联规则同时满足挖掘条件,即第一种负关联规则为客户购买了商品a的情况下,没有购买b并且购买了c;第二种为客户购买了商品a的情况下,又购买了b并且购买了c;显然这两种负关联规则是相互矛盾的,如果都拿来用于决策容易对商场造成误导,因此我们需要一种合理的解决方法来判断哪一条负关联规则适合用于决策。
发明内容
针对现有技术的不足,本发明提供了二次相关判定法选取有效的负关联规则在客 户购买行为分析中的应用;
术语解释
1、关联规则,即AssociationRule,简称AR,是描述数据库中数据项(属性,变量)之间所存在的关系或潜在关系的规则。一个关联规则是形如的蕴涵式;例如:关联规则“说明在所有的顾客事务中,有10%的顾客同时购买了牛奶和面包,其支持度support=10%,而购买了牛奶的顾客中有80%的顾客也购买了面包,其置信度confidence=80%”,这就是有名的支持度-置信度框架(Support-ConfidenceFramework);
2、k-项集,设I={i1,i2,…,im},是由m个不同属性(项目)组成的集合,ik称为项(item),k={1,2,...,m}。事务数据库D是事务T(transaction)的集合,其事务数记作|D|,其中T是项的集合,并且对应每一个事务有唯一的标识,记作TID。设X是一个I中项的集合(项集),如果那么称事务T包含X。若X包含的项的个数为k(1≤k≤m),则称X为k-项集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510963625.2/2.html,转载请声明来源钻瓜专利网。