[发明专利]一种数据挖掘方法及装置在审
申请号: | 201910478937.2 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110188130A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 尤涛;冯晓帅;杜承烈;陈进朝;杨骋昊 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 党娟娟;郭永丽 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种数据挖掘方法及装置,涉及计算机领域。用以解决现有技术中面向不确定数据挖掘频繁闭项集的算法存在计算过程比较繁琐以及效率较低的问题。该方法包括:根据不确定数据包含的项集及项集的内项,建立初始频繁闭项集结构,遍历初始频繁闭项集结构每一层内包含的项集,根据每个项集的直接后继,建立基于频繁闭项集的闭关系图;根据项集在相应事务对应的事务概率,通过动态规划法确定项集的频繁概率;通过广度优先法遍历基于频繁闭项集的闭关系图,得到项集的直接后继,通过容斥定理确定项集的频繁非闭概率,结合项集的频繁概率计算得到项集的频繁闭概率,从而得到不确定数据中满足概率频繁闭阈值的概率频繁闭项集。 | ||
搜索关键词: | 概率 数据挖掘 遍历 动态规划法 计算机领域 概率计算 广度优先 计算过程 数据包含 算法 事务 | ||
【主权项】:
1.一种数据挖掘方法,其特征在于,包括:根据不确定数据包含的项集及所述项集的内项,建立初始频繁闭项集结构,所述初始频繁闭项集结构包含的层数不大于最大所述内项对应的数量;遍历所述初始频繁闭项集结构每一层内包含的所述项集,根据每个所述项集的直接后继,建立基于频繁闭项集的闭关系图;根据所述项集在相应事务对应的事务概率,通过动态规划确定所述项集的频繁概率;通过广度优先法遍历所述项集的直接后继,通过容斥定理确定所述项集的频繁非闭概率,根据所述频繁概率,所述频繁非闭概率和概率频繁闭阈值确定所述不确定数据的概率频繁闭项集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910478937.2/,转载请声明来源钻瓜专利网。