[发明专利]一种面向大规模数据的关联规则树挖掘方法在审

申请号：	201610221837.8	申请日：	2016-04-11
公开（公告）号：	CN105912660A	公开（公告）日：	2016-08-31
发明（设计）人：	王昌栋;赖剑煌;李宏钊	申请（专利权）人：	中山大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	林丽明
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种面向大规模数据的关联规则树挖掘方法，包括以下步骤：S1.对原始数据进行预处理，将原始数据的数据结构处理为便于遍历的数据结构；S2.遍历每项数据，将每项数据包含的属性名、属性名的值名及其支持度缓存起来，生成1‑候选项集C₁；S3.由1‑候选项集C₁生成1‑频繁项集L₁；S4.由k‑频繁项集L_k生成k+1‑候选项集C_k+1；S5.由k+1‑候选项集C_k+1生成k+1‑频繁项集L_k+1；S6.重复执行步骤S4～S5直至不能生成新的k+1‑频繁项集L_k+1；S7.将步骤S6获得的所有的频繁项集用于生成规则；S8.过滤出能被规则分类的数据，不能被规则分类的数据重复执行步骤S1～步骤S7，直至没有规则生成。
搜索关键词：	一种面向大规模数据关联规则挖掘方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种面向大规模数据的关联规则树挖掘方法，其特征在于：包括以下步骤：S1.对原始数据进行预处理，将原始数据的数据结构处理为便于遍历的数据结构；S2.遍历每项数据，将每项数据包含的属性名、属性名的值名及其支持度缓存起来，生成1‑候选项集C₁；S3.由1‑候选项集C₁生成1‑频繁项集L₁；S4.由k‑频繁项集L_k生成k+1‑候选项集C_k+1：设k‑频繁项集L_k中某一个项集为I，找出该项集中属性名最靠右的属性，设为A，然后在1‑频繁项集L₁中找到一个比A更靠右的属性，拼接到I的后面；对k‑频繁项集L_k中所有的项集进行以上操作，则生成了k+1‑候选项集C_k+1；S5.由k+1‑候选项集C_k+1生成k+1‑频繁项集L_k+1；S6.重复执行步骤S4～S5直至不能生成新的k+1‑频繁项集L_k+1；S7.将步骤S6获得的所有的频繁项集用于生成规则；S8.过滤出能被规则分类的数据，不能被规则分类的数据重复执行步骤S1～步骤S7，直至没有规则生成。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610221837.8/，转载请声明来源钻瓜专利网。

上一篇：一种Neo4j向关系型数据库的模型转换和数据迁移方法
下一篇：一种基于Map/Reduce的ETL数据处理方法和装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向大规模数据的关联规则树挖掘方法在审

专利文献下载