[发明专利]一种雾环境下基于CFI-Apriori算法的元组度量方法及系统有效
申请号: | 201911081871.X | 申请日: | 2019-11-07 |
公开(公告)号: | CN111125183B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 林福宏;吴青青;周成成;陆月明;许海涛;安建伟 | 申请(专利权)人: | 北京科技大学;北京邮电大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/2455;G06F9/46 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 环境 基于 cfi apriori 算法 度量 方法 系统 | ||
1.一种雾环境下基于CFI-Apriori算法的元组度量方法,其特征在于,包括:
获取雾节点上的原始数据;
在雾节点本地利用基于CFI的Apriori算法对获取的原始数据进行关联,产生频繁项集,并对剪枝过程小于最小支持度的候选频繁项集进行存储,其中,CFI表示候选频繁项集,小于最小支持度的候选频繁项集为非频繁项集;
将获取的原始数据、产生的频繁项集和存储的非频繁项集上传到云服务器,以便云服务器根据接收到频繁项集和非频繁项集集对接收到的原始数据进行关联、度量,并根据度量结果提取数据;
其中,所述云服务器根据接收到频繁项集和非频繁项集集对接收到的原始数据进行关联、度量,并根据度量结果提取数据包括:
云服务器根据接收到频繁项集和非频繁项集集对接收到的原始数据进行关联,基于用户需求和项集占比对关联后的数据进行度量,根据度量结果提取数据;
其中,所述云服务器根据接收到频繁项集和非频繁项集集对接收到的原始数据进行关联,基于用户需求和项集占比对关联后的数据进行度量,根据度量结果提取数据包括:
在云服务器,根据接收到的频繁项集和非频繁项集,对接收到的原始数据进行关联,并根据关联后的数据生成相应的子事务表;其中,子事务表中每行表示一个元组,元组是由事务组成;
确定子事务表中元组Dj中频繁i项集与非频繁i项集的数目xi占元组Dj中i项组合的组合集中组合数目的比值p(xi);其中,Dj表示第j行元组,xi表示i项集的数目;
确定xi的权值wi,其中,wi由p(xi)与用户需求共同确定;
根据p(xi)和wi确定元组Dj的价值Qj;
判定价值Qj是否大于预设的价值阈值,若是,则元组Dj利用性高,提取元组Dj。
2.根据权利要求1所述的雾环境下基于CFI-Apriori算法的元组度量方法,其特征在于,所述在雾节点本地利用基于CFI的Apriori算法对获取的原始数据进行关联,产生频繁项集,并对剪枝过程小于最小支持度的候选频繁项集进行存储包括:
A1,在雾节点本地,生成原始数据对应的事务表,令k=1,扫描事务表,其中,k表示项集中元素的数目;
A2,生成候选频繁k项集的集合Ck,从集合Ck中,选取支持度大于等于最小支持度的候选项集,生成频繁k项集的集合Lk;若Lk为空,则结束;若Lk不为空,则继续执行步骤A3;其中,若k1时,将小于最小支持度的候选频繁k项集储存在内存中;若k=1,将小于最小支持度的候选频繁1项集删除;
A3,从频繁k项集的集合Lk中取出两个频繁项集,若取出的两个频繁项集有且只有k-1个项相同,则取出的两个频繁项集进行连接,得到候选频繁(k+1)项集;
A4,重复执行步骤A3,直至得到的候选频繁(k+1)项集不在重复,得到候选频繁(k+1)项集的集合Ck+1,若Ck+1不为空,则k=k+1,并返回执行步骤A2;否则,则结束。
3.根据权利要求1所述的雾环境下基于CFI-Apriori算法的元组度量方法,其特征在于,在云服务器根据接收到频繁项集和非频繁项集集对接收到的原始数据进行关联、度量之前,所述方法还包括:
云服务器对接收到的频繁项集和非频繁项集进行去重处理。
4.根据权利要求1所述的雾环境下基于CFI-Apriori算法的元组度量方法,其特征在于,价值Qj表示为:
其中,n表示元组Dj中最大项集包含的事务的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学;北京邮电大学,未经北京科技大学;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911081871.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种RJ45网口的硬件调试方法
- 下一篇:一种雾计算负载均衡方法及系统