[发明专利]一种关联规则的挖掘方法和关联规则的挖掘装置在审
申请号: | 201610005402.X | 申请日: | 2016-01-05 |
公开(公告)号: | CN105677837A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 刘军;陈凯;钱静;刘萍 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 郝明琴 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关联 规则 挖掘 方法 装置 | ||
1.一种关联规则的挖掘方法,其特征在于:所述挖掘方法包括以下步骤:
获取和扫描事务集,将所述事务集转化为多维数据立方体,并记录下整个 事务集的长度;
根据所述多维数据立方体得到1-项集和1-项频繁集;
根据1-项频繁集得到k-项集和k-项频繁集,以及根据k-项频繁集得到 k+1-项集和k+1-项频繁集,其中k为大于且等于2的正整数;
根据1-项频繁集和k-项频繁集,产生1-项频繁集和k-项频繁集的所有子 集以生成所述事务集的关联规则。
2.如权利要求1所述的挖掘方法,其特征在于:所述多维数据立方体包括 单值数据立方体,多值无序数据立方体,多值有序数据立方体和属性数据立方 体。
3.如权利要求1或2所述的挖掘方法,其特征在于:所述将所述事务集转 化为多维数据立方体的步骤,包括以下步骤:
根据所述事务集中每个事务的项的取值,将所述事务集转化为多维数据立 方体。
4.如权利要求3的挖掘方法,其特征在于:所述根据所述多维数据立方体 得到1-项集和1-项频繁集的步骤,包括以下步骤:
统计所述事务集中每个值在每个维度上的出现频率以及每个维度上每个 值的支持度,得到1-项集;
查找其支持度大于预设的支持度的1-项集,得到1-项频繁集。
5.如权利要求3的挖掘方法,其特征在于:根据1-项频繁集得到k-项集 和k-项频繁集,以及根据k-项频繁集得到k+1-项集和k+1-项频繁集,包括以 下步骤:
将1-项频繁集中的每两个频繁项进行逻辑或运算再进行求和运算,得到 1-项频繁集中的多个运算结果;
判断每个运算结果是否等于2,如果是,所述运算结果对应的两个频繁项 进行相交,得到当前2-项集;
计算当前2-项集的支持度,查找其支持度大于最小支持度的2-项集,得 到2-项频繁集;
重复由1-项集生成2-项频繁集的过程,将k-项频繁集中的每两个频繁项 进行“逻辑或”运算再进行求和运算,得到k-项频繁集中的多个运算结果;
判断每个运算结果是否等于k+1,如果是,所述运算结果对应的两个频繁 项进行相交,以及根据所述相交结果得到当前的k+1-项集;
计算当前k+1-项集的支持度,查找其支持度大于最小支持度的k+1-项集, 得到k+1-项频繁集。
6.如权利要求3的挖掘方法,其特征在于:根据1-项频繁集得到k-项集 和k-项频繁集,以及根据k-项频繁集得到k+1-项集和k+1-项频繁集,包括以 下步骤:
将1-项频繁集中的每两个频繁项进行逻辑或运算再进行求和运算,得到 1-项频繁集中的多个运算结果;
判断每个运算结果是否等于2,如果是,所述运算结果对应的两个频繁项 进行相交,得到当前2-项集;
计算当前2-项集的支持度,查找其支持度大于最小支持度的2-项集,得 到2-项频繁集;
将k-项集与1-项频繁集进行逻辑或运算再进行求和运算,如果运算结果 等于k+1,则进行相交,得到k+1-项集;
计算当前k+1-项集的支持度,查找其支持度大于最小支持度的k+1-项集, 得到k+1-项频繁集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610005402.X/1.html,转载请声明来源钻瓜专利网。