[发明专利]面向实时频繁项集挖掘的加速系统及方法有效
申请号: | 201610709592.3 | 申请日: | 2016-08-23 |
公开(公告)号: | CN106371917B | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 孙羽良;汪玉 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向实时频繁项集挖掘的加速系统及方法,其中,系统包括:缓存模块,接收初始化参数,其中,对于初始化参数进行一次读取;比特流编码模块,将初始化参数进行比特流编码,以生成等效横向比特向量;第一主模块,根据初始化参数生成多个子集计数器内容列表,以得到部分频繁项集;控制器,获取相应的频繁元素;第二主模块,用于进行近似计算得到最终频繁项集挖掘结果;比特流解码模块,将最终频繁项集挖掘结果进行比特流解码,以输出最终频繁项集挖掘结果至主机。该系统能够实现高效率的近似频繁项集挖掘算法,只需要对输入数据进行一次扫描,特别适用于流数据或有实时性要求的应用场景。 | ||
搜索关键词: | 面向 实时 频繁 挖掘 加速 系统 方法 | ||
【主权项】:
1.一种面向实时频繁项集挖掘的加速系统,其特征在于,包括:缓存模块,用于接收主机以数据流的方式发送的频繁项集挖掘初始化参数,其中,对于所述初始化参数进行一次读取;比特流编码模块,用于将所述初始化参数进行比特流编码,以生成等效横向比特向量;第一主模块,所述第一主模块具有多个计数器,用于根据所述初始化参数生成多个子集计数器内容列表,以根据所述等效横向比特向量和预设阈值得到部分频繁项集,其中,所述第一主模块具体用于将所述等效横向比特向量依次输入所述计数器,以利用流水线并行计算进行比对,从而在输入数据不发生阻塞的情况下,每个计数器的输入数据可以在每一个时钟周期进行更新,并在一个时钟周期内传递给相邻的计数器,得到所述频繁项集;控制器,用于根据所述部分频繁项集获取相应的频繁元素;第二主模块,用于根据所述部分频繁项集和所述频繁元素整合得到频繁项集的比特流,以进行近似计算得到最终频繁项集挖掘结果;以及比特流解码模块,用于将所述最终频繁项集挖掘结果进行比特流解码,以输出所述最终频繁项集挖掘结果至所述主机。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610709592.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种存储系统IO线程优化方法及其装置
- 下一篇:任务集群调度管理方法及装置