[发明专利]一种基于大数据平台的频繁模式挖掘方法有效

专利信息
申请号: 201711384435.0 申请日: 2017-12-20
公开(公告)号: CN108197172B 公开(公告)日: 2021-06-22
发明(设计)人: 刘君强;江波 申请(专利权)人: 浙江工商大学
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 林松海
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于大数据平台的频繁模式挖掘方法。它利用大数据平台从海量数据中发现满足用户需求的频繁模式,一是采用混合的搜索策略,将宽度优先搜索和深度优先搜索相结合,实现混合挖掘,二是采用混合垂直数据格式来表示数据,充分利用交集与差集的运算特点保证垂直数据格式始终保持最小状态,同时实现水平数据格式与垂直数据格式的相互转换,并采用了基于快速失败机制的交叉计算优化方案提高计算效率,三是在宽度优先搜索挖掘阶段采用基于有序搜索树的快速剪枝策略,提高剪枝效率,四是结合大数据平台的特性,进行有效地缓存和均衡分组,实现整个系统负载均衡。
搜索关键词: 一种 基于 数据 平台 频繁 模式 挖掘 方法
【主权项】:
1.一种基于大数据平台的频繁模式挖掘方法,其特征在于,根据事务数据库D、用户设置的最小支持度𝜎,快速地从D中发掘出频繁度不低于𝜎的模式,主要包括以下步骤:(1)数据输入;(2)统计频繁1‑项集和2‑项集;(3)估算最大内存上限值SMUB,对搜索策略进行划分;(4)混合挖掘;(5) 数据输出;其中所述步骤(2)和(4)中的宽度挖掘阶段的垂直数据格式采用混合数据格式,并采用基于快速失败机制的交叉计算优化方案提高计算速率,同时采用基于有序搜索树的快速剪枝方案避免资源浪费问题;所述步骤(3)中对搜索策略进行了划分,从单一搜索策略转入混合搜索,在所述步骤(4)中按照混合搜索策略执行混合挖掘任务,所述步骤(4)中进行混合挖掘时对宽度挖掘进行有效的缓存机制来降低中间输出量,同时对于深度挖掘采用均衡分组方案实现整个系统
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711384435.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top