[发明专利]一种面向精准营销的加权频繁项集挖掘算法在审
申请号: | 201811241007.7 | 申请日: | 2018-10-24 |
公开(公告)号: | CN109558435A | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 赵学健;熊肖肖;孙知信;张登银 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q30/02 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 牛莉莉 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 精准营销 频繁项集 挖掘算法 加权 客户 访问行为 购买商品 时间效率 营销策略 运营效率 重要意义 购物车 喜好度 企业利润 权重 赋予 算法 购买 浏览 收藏 挖掘 概率 利润 销售 分析 | ||
本发明提出了一种面向精准营销的加权频繁项集挖掘算法,该发明首先针对销售企业的营销策略存在找客户难,获客成本高,运营效率低等问题,对客户前期的购买行为和客户在电商平台的访问行为进行分析,分别对购买商品、点击浏览、收藏商品及加入购物车等行为赋予不同的购买概率值,以反映用户对不同项目的喜好度;其次,根据某商品的利润占企业利润的比例为该商品赋予不同的权重,以反映不同商品对企业的重要程度;本发明提高算法的时间效率,有利于从海量不确定数据中迅速挖掘出对用户具有重要意义的频繁项集信息,实现精准营销。
技术领域
本发明属于计算机数据挖掘及信息处理技术领域,尤其涉及一种面向精准营销的基于Top-K查询的不确定数据加权频繁项集挖掘算法。
背景技术
目前,不确定数据广泛应用于传感器网络、RFID应用、Web应用、商业决策、精准营销等诸多领域[1]。数据的不确定性给频繁模式挖掘带来了极大挑战,一方面是相对于数据规模呈指数增长的可能世界实例的数量,另一方面是新出现的概率维度,这导致传统的针对确定性数据的频繁模式挖掘算法准确性和时效性大大降低,不能满足具体的应用需求。
此外,当前面向不确定数据的频繁项集挖掘研究尚处于研究的初始阶段,大多数研究都假设事务数据库中的项目具有相同的重要性。然而,现实应用中对于用户来讲,往往不同的项目其重要性和价值是有巨大差别的,比如在商品销售过程中价格昂贵的奢侈品和价格低廉的生活用品所带来的利润是不可同日而语的。为了解决该问题,最有效的解决办法是给不同的项目赋予不同的权重值。权重值可以由用户根据专业领域知识或者特定应用需求进行设定,可以用来表示项目的利润、风险、代价等。这样以来,频繁项集的挖掘就能够兼顾项目的权重和存在概率,从而克服了传统频繁项集挖掘算法只考虑项目的存在概率,容易遗漏大量具有重要潜在价值的频繁项集的问题。然而,项目权重值的引入使得频繁项集不再满足向下闭包特性,也就是说即使某项集是非频繁项集,其超集仍有可能是频繁项集。这给频繁项集的挖掘带来了巨大挑战,因为我们不能再根据向下封闭特性对频繁项集的搜索空间进行压缩。
因此,针对不确定数据的加权频繁项集挖掘迫切需要提出新的理论模型和算法解决不确定数据的频繁模式挖掘问题。当前,针对不确定数据集的加权频繁项集挖掘问题研究尚未引起重视,研究成果极少。Lin等人最近提出了用于不确定数据库加权频繁项集挖掘的HEWI-Uapriori算法[2],该算法使用带上限的期望加权向下闭包特性对非频繁项集进行缩减,以提高算法的时间效率,然而该算法仍然需要两轮全面扫描数据集,算法的时间效率有待进一步提升,尤其是当待挖掘数据集为稠密数据集时,算法的时间效率更是不尽人意。
文献引用[1]汪金苗,张龙波,邓齐志,等.不确定数据频繁项集挖掘方法综述[J].计算机工程与应用,2011,47(20):121-125.[2]Lin C W,Gan W, Fournier-viger P,etal.Weighted frequent itemset mining over uncertain databases (面向不确定数据集的加权频繁项集挖掘).Applied Intelligence,2016, 44(1):1-19.doi:10.1007/s10489-015-0703-9.
发明内容
本发明针对销售企业找客户难,获客成本高,运营效率低等问题,提供了一种面向精准营销的基于Top-K查询的不确定数据加权频繁项集挖掘算法。
本发明采用以下技术方案:
面向精准营销的加权频繁项集挖掘算法,包括如下步骤:
步骤1、对客户前期的购买行为和客户在电商平台的访问行为进行预处理,构建用户行为数据集D;
步骤2、根据不同商品(即项目)对企业的重要程度为不同的商品赋予不同的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811241007.7/2.html,转载请声明来源钻瓜专利网。