[发明专利]一种基于向量运算的关联规则挖掘方法在审
申请号: | 201510729332.8 | 申请日: | 2015-10-30 |
公开(公告)号: | CN105335785A | 公开(公告)日: | 2016-02-17 |
发明(设计)人: | 周斌;裴峥;李波 | 申请(专利权)人: | 西华大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02 |
代理公司: | 四川力久律师事务所 51221 | 代理人: | 王芸;林辉轮 |
地址: | 610030 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 向量 运算 关联 规则 挖掘 方法 | ||
技术领域
本发明涉及数据挖掘领域,特别是涉及一种基于向量运算的关联规则挖掘方法。
背景技术
关联规则挖掘的目的是从大数据库中挖掘由数量关系确定的属性之间的关联规则,典型的关联规则挖掘例子是“90%的顾客如果购买面包和黄油,那么也购买牛奶”,其中,“面包和黄油”是关联规则前件,牛奶是后件,90%为关联规则的可信度。属性关联规则是对大数据中有用知识的科学、合理刻画,已广泛应用于计算机科学、管理科学、经济学、社会科学等领域。将支持度和可信度作为目标函数,属性关联规则挖掘可转化为一个优化问题,而挖掘出的属性关联规则就是满足目标函数的较优解。
目前,基于优化模型的属性关联规则挖掘方法已有很多,在该类方法中,各种优化方法或智能优化算法,如shafer证据理论、有向图方法、主成分分析方法、进化计算、粒子群算法及遗传算法等,被用于从某一属性子集中挖掘相应的属性关联规则。在现有的属性关联规则挖掘中,频繁闭项集的极小生成元用来生成一类Min-Max关联规则,即令A′是一频繁闭项集,B是A′的一个极小生成元,则B→(A′-B)是一条Min-Max关联规则。
通过分析可得,现有的属性关联规则挖掘通常在属性集的幂集或频繁闭项集的幂集中挖掘满足条件的属性关联规则,在挖掘过程中,相关运算通常会在对象和属性之间重复进行,同时会涉及较复杂的幂集运算,导致对象集上的闭包算子运算量大,使得运算效率低下。
发明内容
为了解决上述潜在的问题,本发明的目的在于克服现有技术中所存在的上述不足,提供一种能够简单快速的得到属性关联规则的挖掘方法。
为了实现上述发明目的,本发明采用的技术方案是:
一种基于向量运算的关联规则挖掘方法,包括以下步骤:
定义对象和属性的向量表示,约定对象向量和属性向量的运算规则,用于计算属性集上的向量基;
根据向量基计算生成属性集上的向量;
根据所述属性集上的向量计算属性集上的任一向量的支持度;
设定向量基的支持度阈值,筛选出大于支持度阈值条件的向量;
根据预先设定的可信度阈值,在所述大于支持度阈值条件的向量中挖掘满足条件的属性关联规则。
进一步地,所述定义对象和属性的向量表示,约定对象向量和属性向量的运算规则包括:
定义信息系统I表示为:I=(U,A,f),U表示对象集、A表示属性集,其中U={u1,…,un},A={a1,…,am},un表示对象集中第n个元素、am表示属性集中第m个元素;
f称为I的信息函数,即f:U×A→{0,1},对任意(ui,aj)∈U×A,若f(ui,aj)=pij=0,则称第i个对象ui不具有第j个属性aj;若f(ui,aj)=pij=1,则称第i个对象ui具有第j个属性aj。
定义A1→A2为一条属性关联规则,其中,且A1称为前件,A2称为后件;
定义ui=(pi1,…,pim)1×m,表示对象ui可表示为由0或1构成的m维行向量;
定义表示属性aj可表示为由0或1构成的n维列向量;
约定如下向量运算规则,1οui=ui、0οui=11×m=(1,…,1)1×m、1οaj=aj、其中,(1,…,1)1×m表示元素全为1的m维行向量,表示元素全为1的n维列向量;
约定属性aj与(u1,…,un)之间的向量运算规则如下,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学,未经西华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510729332.8/2.html,转载请声明来源钻瓜专利网。