[发明专利]一种基于区间映射求交的快速频繁模式挖掘方法及系统在审
申请号: | 201710795811.9 | 申请日: | 2017-09-06 |
公开(公告)号: | CN107545063A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 程良伦;吴磊 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510062 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于区间映射求交的快速频繁模式挖掘方法及系统,该方法中,先扫描出目标数据集对应的频繁1项集和FP树,并生成每个频繁1项集对应的区间集,进而利用频繁1项集和频繁n‑1项集生成当前的候选n项集,然后基于区间求交方式,在频繁1项集和频繁n‑1项集各自对应的区间集之间进行求交处理,从而得到当前候选n项集对应的区间集,根据该区间集确定出当前候选n项集的支持度,接着基于当前候选n项集的支持度的大小程度来确定是否将该候选n项集归为频繁n项集,相对于现有技术中的Apriori算法和FP‑growth算法等频繁模式挖掘算法,本申请公开的上述频繁模式挖掘方案具有更高的挖掘效率,大幅减少了频繁模式的挖掘耗时。 | ||
搜索关键词: | 一种 基于 区间 映射 快速 频繁 模式 挖掘 方法 系统 | ||
【主权项】:
一种基于区间映射求交的快速频繁模式挖掘方法,其特征在于,包括:步骤S11:对目标数据集进行扫描,得到所述目标数据集的频繁1项集;步骤S12:对所述目标数据集再次进行扫描,以构造相应的FP树;步骤S13:对所述FP树进行扫描,为每个频繁1项集生成相应的区间集;步骤S14:将n初始化为2;步骤S15:利用频繁1项集和频繁n‑1项集生成当前候选n项集;步骤S16:利用生成当前候选n项集的频繁1项集和频繁n‑1项集各自对应的区间集,基于区间求交方式生成当前候选n项集对应的区间集;步骤S17:根据当前候选n项集对应的区间集,确定当前候选n项集的支持度,并判断当前候选n项集的支持度是否大于临界值,如果是,则将当前候选n项集加入到预设的频繁n项集列表;步骤S18:判断当前频繁n项集列表是否为空,如果是,则结束,如果否,则令n=n+1,并重新进入步骤S15。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710795811.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种采矿用多级矿石粉碎装置
- 下一篇:一种水选式矿石开采用粉碎机