[发明专利]一种电网企业关键数据分析方法有效

专利信息
申请号: 201710704564.7 申请日: 2017-08-16
公开(公告)号: CN107578149B 公开(公告)日: 2020-08-11
发明(设计)人: 施永益;王锋华;夏洪涛;朱国荣;冯昊;叶玲节;陈俊;纪德良;石佳;沈磊 申请(专利权)人: 国网浙江省电力公司经济技术研究院;国网浙江省电力公司;浙江华云信息科技有限公司;杭州宇维科技有限公司
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q50/06
代理公司: 浙江翔隆专利事务所(普通合伙) 33206 代理人: 张建青
地址: 310008 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电网 企业 关键 数据 分析 方法
【说明书】:

发明公开了一种电网企业关键数据分析方法。针对Apriori算法频繁扫描数据库的问题,国内外学者在此方面进行了大量的研究工作,但仍存在较多问题。本发明包括建立电网企业运营绩效指标检测体系、基于蒙特卡罗模拟方法设置动态阈值调整和采用改进型Apriori算法量化数据组之间关联关系;采用改进型Apriori算法量化数据组之间关联关系的过程包括改进型Apriori算法挖掘频繁项,即通过改进Apriori算法,挖掘候选集中的频繁项。本发明可以有效地通过基础变化数据对企业运营的评价指标数据进行分析,有效提高了计算效率。

技术领域

本发明涉及数据挖掘领域,具体地说是一种基于改进Apriori算法和蒙特卡洛模拟的电网企业关键数据分析方法。

背景技术

随着电力行业的信息化发展,电网企业运营的数据也得到了快速增长,对电力大数据进行研究对电能资源的优化配置,能源效率水平的提升,电网企业运营利润率的提高有重要意义。电力大数据在电网运营方面的价值在于挖掘运营数据之间的关系和规律,以满足企业电力生产和经营管理的需要;构建能够反应企业运行状况的核心指标和能够支撑核心指标提升的关联性指标。数据挖掘作为从大数据中提取有效信息的方法,被越来越多的应用在各行各业,主要指的是发现数据库中的隐藏信息和潜在模式。作为数据挖掘最重要的分支之一,关联性算法一般包含两个方向:1)通过预定义的阈值筛选出频繁项;2)生成满足置信度要求的关联规则。

Apriori算法是挖掘关联规则的常见重要算法,主要通过预定义数据组之间的最小支持度和最小置信度值,筛选出数据组满足阈值条件的频繁项,并根据频繁项之间的支持度和置信度,对数据组之间的关联关系进行进一步的量化。虽然经典Apriori算法的表现比不上现有的最新深度优先搜索方法,但是其仍然被认为是最重要的关联性挖掘算法。因为Apriori算法基本思想是寻找给定数据集中所有频繁项,这种通用的思想和操作办法可以应用在任何数据库中的关联性挖掘中。而深度优先搜索算法则既受到所构建FP-tree的结构复杂性制约,又受到记录节点的物理存储消耗的限制。

近年来也有许多国内外学者在此方面进行了大量的研究工作,针对Apriori算法频繁扫描数据库的问题,Park等人提出了直接散列和修建算法(Direct Hashing andPruning)算法,其利用散列(hash)的方法来产生候选集,但是当数据库中项目集数量较多时,哈希表的生成效率会因计算量而大幅下降。Toivonen通过采样(sampling)产生候选集,虽然采样可以有效的实现频繁项的抽取,但是由于采样过程的随机性,很容易造成数据的关联规则挖掘不完善。Don和Han等人提出BitTableFI算法,具体操作为将数据库压缩在BitTable中,因此候选集项的选取和支持度的计算都可以根据BitTable特殊的数据结构快速实现。Bhandari等人将FP-tree方法与Apriori算法相结合,提出了I-Apriori算法,其主要思想是在搜寻候选频繁项时所扫描减少事物集的数目,以达到节约时间的目的。Zhao等人提出了基于位表的频繁项挖掘算法BITXOR,通过二进制序列来表示数据项。

发明内容

本发明所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种基于改进Apriori算法和蒙特卡洛模拟的电网企业关键数据分析方法,以有效提高计算效率,得出对结果型数据影响较大的数据为目的。

为此,本发明采用如下的技术方案:一种电网企业关键数据分析方法,包括建立电网企业运营绩效指标检测体系、基于蒙特卡罗模拟方法设置动态阈值调整和采用改进型Apriori算法量化数据组之间关联关系;

采用改进型Apriori算法量化数据组之间关联关系的过程包括改进型Apriori算法挖掘频繁项,所述的改进型Apriori算法挖掘频繁项包括以下步骤:

1)仅对数据库进行一次扫描,对每一个项目得到事物项标识;

2)计算所有项在Lk-1中出现的次数,删除小于k-1的项,将剩余项保存为候选集Ck

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力公司经济技术研究院;国网浙江省电力公司;浙江华云信息科技有限公司;杭州宇维科技有限公司,未经国网浙江省电力公司经济技术研究院;国网浙江省电力公司;浙江华云信息科技有限公司;杭州宇维科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710704564.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top