[发明专利]一种处理交易事务数据库数据的方法和装置在审
申请号: | 201510894914.1 | 申请日: | 2015-12-07 |
公开(公告)号: | CN105354336A | 公开(公告)日: | 2016-02-24 |
发明(设计)人: | 冯研 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 张全文 |
地址: | 516006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 交易 事务 数据库 数据 方法 装置 | ||
1.一种处理交易事务数据库数据的方法,其特征在于,所述方法包括:
将交易事务数据库的数据分成N份以获得N个分块事务数据库,并按照每个计算节点一个分块事务数据库的方式分发至N个并行处理的计算节点,所述N为大于1的自然数;
所述每个计算节点将各自分得的分块事务数据库转化为压缩的事务布尔矩阵;
所述N个并行处理的计算节点通过对所述压缩的事务布尔矩阵的行向量或列向量进行相“与”计算,得到所有k-频繁项集,所述k为自然数。
2.如权利要求1所述的方法,其特征在于,所述每个计算节点将各自分得的分块事务数据库转化为压缩的事务布尔矩阵,包括:
将所述分块事务数据库中所有相同的交易事务记录为一条交易事务Ti;
使用数组TS[s]中的元素TS[i]记录所述交易事务Ti在所述分块事务数据库中的实际条数。
3.如权利要求1所述的方法,其特征在于,所述N个并行处理的计算节点包括一个主计算节点和N-1个非主计算节点,所述事务布尔矩阵的元素为dij,并且
所述N个并行处理的计算节点通过对所述压缩的事务布尔矩阵的行向量或列向量进行相“与”计算,得到所有k-频繁项集,包括:
所述主计算节点计算k-频繁项集,并根据所述k-频繁项集生成(k+1)-候选集;
所述主计算节点将所述(k+1)-候选集广播至所述N-1个非主计算节点;
所述N-1个非主计算节点根据接收到的所述(k+1)-候选集,通过对k+1个项构成的项集{Ip,Iq,…,Ii,Ij}的各个项在各自节点上的事务布尔矩阵对应的行向量和事务计数向量进行相“与”计算,得到项集{Ip,Iq,…,Ii,Ij}的本地支持度计数并转发至所述主计算节点;
所述主计算节点根据所述项集{Ip,Iq,…,Ii,Ij}的各个项的本地支持度计数计算得到(k+1)-频繁项集;
循环上述步骤,直至被筛选后的项集为空集或者只有一个项集时得到所有k-频繁项集。
4.如权利要求3所述的方法,其特征在于,所述主计算节点计算k-频繁项集,并根据所述k-频繁项集生成(k+1)-候选集,包括:
所述N-1个非主计算节点计算本节点上由k个项构成的项集{Ip,Iq,…,Ii}的各个项的本地支持度计数并转发至所述主计算节点;
所述主计算节点根据所述项集{Ip,Iq,…,Ii}各个项的本地支持度计数计算k-频繁项集;
所述主计算节点根据所述k-频繁项集生成(k+1)-候选集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510894914.1/1.html,转载请声明来源钻瓜专利网。