[发明专利]一种电网企业关键数据分析方法有效
申请号: | 201710704564.7 | 申请日: | 2017-08-16 |
公开(公告)号: | CN107578149B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 施永益;王锋华;夏洪涛;朱国荣;冯昊;叶玲节;陈俊;纪德良;石佳;沈磊 | 申请(专利权)人: | 国网浙江省电力公司经济技术研究院;国网浙江省电力公司;浙江华云信息科技有限公司;杭州宇维科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 张建青 |
地址: | 310008 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电网 企业 关键 数据 分析 方法 | ||
本发明公开了一种电网企业关键数据分析方法。针对Apriori算法频繁扫描数据库的问题,国内外学者在此方面进行了大量的研究工作,但仍存在较多问题。本发明包括建立电网企业运营绩效指标检测体系、基于蒙特卡罗模拟方法设置动态阈值调整和采用改进型Apriori算法量化数据组之间关联关系;采用改进型Apriori算法量化数据组之间关联关系的过程包括改进型Apriori算法挖掘频繁项,即通过改进Apriori算法,挖掘候选集中的频繁项。本发明可以有效地通过基础变化数据对企业运营的评价指标数据进行分析,有效提高了计算效率。
技术领域
本发明涉及数据挖掘领域,具体地说是一种基于改进Apriori算法和蒙特卡洛模拟的电网企业关键数据分析方法。
背景技术
随着电力行业的信息化发展,电网企业运营的数据也得到了快速增长,对电力大数据进行研究对电能资源的优化配置,能源效率水平的提升,电网企业运营利润率的提高有重要意义。电力大数据在电网运营方面的价值在于挖掘运营数据之间的关系和规律,以满足企业电力生产和经营管理的需要;构建能够反应企业运行状况的核心指标和能够支撑核心指标提升的关联性指标。数据挖掘作为从大数据中提取有效信息的方法,被越来越多的应用在各行各业,主要指的是发现数据库中的隐藏信息和潜在模式。作为数据挖掘最重要的分支之一,关联性算法一般包含两个方向:1)通过预定义的阈值筛选出频繁项;2)生成满足置信度要求的关联规则。
Apriori算法是挖掘关联规则的常见重要算法,主要通过预定义数据组之间的最小支持度和最小置信度值,筛选出数据组满足阈值条件的频繁项,并根据频繁项之间的支持度和置信度,对数据组之间的关联关系进行进一步的量化。虽然经典Apriori算法的表现比不上现有的最新深度优先搜索方法,但是其仍然被认为是最重要的关联性挖掘算法。因为Apriori算法基本思想是寻找给定数据集中所有频繁项,这种通用的思想和操作办法可以应用在任何数据库中的关联性挖掘中。而深度优先搜索算法则既受到所构建FP-tree的结构复杂性制约,又受到记录节点的物理存储消耗的限制。
近年来也有许多国内外学者在此方面进行了大量的研究工作,针对Apriori算法频繁扫描数据库的问题,Park等人提出了直接散列和修建算法(Direct Hashing andPruning)算法,其利用散列(hash)的方法来产生候选集,但是当数据库中项目集数量较多时,哈希表的生成效率会因计算量而大幅下降。Toivonen通过采样(sampling)产生候选集,虽然采样可以有效的实现频繁项的抽取,但是由于采样过程的随机性,很容易造成数据的关联规则挖掘不完善。Don和Han等人提出BitTableFI算法,具体操作为将数据库压缩在BitTable中,因此候选集项的选取和支持度的计算都可以根据BitTable特殊的数据结构快速实现。Bhandari等人将FP-tree方法与Apriori算法相结合,提出了I-Apriori算法,其主要思想是在搜寻候选频繁项时所扫描减少事物集的数目,以达到节约时间的目的。Zhao等人提出了基于位表的频繁项挖掘算法BITXOR,通过二进制序列来表示数据项。
发明内容
本发明所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种基于改进Apriori算法和蒙特卡洛模拟的电网企业关键数据分析方法,以有效提高计算效率,得出对结果型数据影响较大的数据为目的。
为此,本发明采用如下的技术方案:一种电网企业关键数据分析方法,包括建立电网企业运营绩效指标检测体系、基于蒙特卡罗模拟方法设置动态阈值调整和采用改进型Apriori算法量化数据组之间关联关系;
采用改进型Apriori算法量化数据组之间关联关系的过程包括改进型Apriori算法挖掘频繁项,所述的改进型Apriori算法挖掘频繁项包括以下步骤:
1)仅对数据库进行一次扫描,对每一个项目得到事物项标识;
2)计算所有项在Lk-1中出现的次数,删除小于k-1的项,将剩余项保存为候选集Ck;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力公司经济技术研究院;国网浙江省电力公司;浙江华云信息科技有限公司;杭州宇维科技有限公司,未经国网浙江省电力公司经济技术研究院;国网浙江省电力公司;浙江华云信息科技有限公司;杭州宇维科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710704564.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:粉煤加压输送装置及粉煤加压气化系统
- 下一篇:料位测量装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置