[发明专利]一种基于低位管理的频繁项集数据挖掘方法在审
申请号: | 201510548391.5 | 申请日: | 2015-08-31 |
公开(公告)号: | CN106484727A | 公开(公告)日: | 2017-03-08 |
发明(设计)人: | 柴明亮;宋宝宇;刘宝权;张岩;李连成;王靖震;宋君;高冰;王奎越;秦大伟 | 申请(专利权)人: | 鞍钢股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 114021 *** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于低位管理的频繁项集数据挖掘方法,首先根据一项集的支持度及其平均值,得到一项集高位和低位,然后,根据一项集域值方差和域值方差平均值对一项集低位进行再处理,得到最终的频繁一项集,最后进行循环处理,第k步,根据k-1步频繁的k-1项集Lk-1按照Apriori_gen产生候选的k项集Ck集,对候选的k项集计算每项的支持度及其平均值和域值方差平均值,找出支持度大于或等于平均支持度的项,作为频繁k项集,简称k项集高位;支持度小于平均支持度的项作为不频繁k项集,简称k项集低位;计算低位k项集域值方差,小于域值方差平均值的项集则进位为高位k项集。此方法得到了有意义的频繁项集,解决了由于人为设定域值带来的频繁项集发现的问题。 | ||
搜索关键词: | 一种 基于 低位 管理 频繁 集数 挖掘 方法 | ||
【主权项】:
一种基于低位管理的频繁项集数据挖掘方法,其特征在于包括以下步骤:⑴频繁一项集的生成,根据数据库计算一项集的支持度及其平均值和域值方差平均值,支持度大于或等于平均支持度的项,作为频繁一项集,简称一项集高位;支持度小于平均支持度的项作为不频繁一项集,简称一项集低位;⑵一项集低位处理,计算低位一项集域值方差,小于域值方差平均值的项集则进位为高位一项集,大于或等于域值方差平均值的项集则认为是不频繁项集;(3)循环处理,第k步,根据k‑1步频繁的k‑1项集Lk‑1按照Apriori_gen产生候选的k项集Ck集,对候选的k项集计算每项的支持度及其平均值和域值方差平均值,找出支持度大于或等于平均支持度的项,作为频繁k项集,简称k项集高位;支持度小于平均支持度的项作为不频繁k项集,简称k项集低位;计算低位k项集域值方差,小于域值方差平均值的项集则进位为高位k项集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鞍钢股份有限公司,未经鞍钢股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510548391.5/,转载请声明来源钻瓜专利网。