[发明专利]一种用电量预测方法及系统在审
申请号: | 201611178142.2 | 申请日: | 2016-12-19 |
公开(公告)号: | CN106779219A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 王继业;高灵超;沈骥;曹鸿谦;于亚光;张海超 | 申请(专利权)人: | 北京中电普华信息技术有限公司;国网信息通信产业集团有限公司;国家电网公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 100192 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用电量 预测 方法 系统 | ||
技术领域
本发明涉及电力数据技术领域,更具体地说,涉及一种用电量预测方法,还涉及一种用电量预测系统。
背景技术
电力是我国国民经济的基础能源,用电量的预测是电力系统规划、经济运行的前提和基础,对于保证电力系统规划与可靠、经济运行方面具有十分重要的意义。电力系统的用电量预测是指通过对历史数据的分析和研究,找出电力数据内部变化规律以及电力数据和其影响因素之间的关联,然后对电力需求做出预先的估算。用电量预测结果的准确性,直接关系到电网安全以及可靠供电,并且能够影响电网经营企业的经营决策与经济效益。
随着智能电网的不断发展,目前已有的预测算法对大规模电力数据进行分析挖掘过程效率低下,无法快速深入挖掘电力数据的潜在信息,也无法满足大规模电力数据的计算和预测分析。具体的,现有用电量预测方法主要分为经典预测方法和现代预测方法。其中经典预测方法包括:时间序列法,回归分析法,趋势外推法等方法;现代预测方法包括:灰色理论,专家系统方法,神经网络方法,模糊预测方法。在预测分析方法上,传统时间序列、灰度模型等方法无法充分考虑天气、季节等因素,导致预测精度受限。神经网络、线性回归等模型在大规模数据的预测上会存在过拟合的现象,而过拟合现象导致模型泛化能力降低,从而影响预测精度。
在对大规模电力数据进行分析中,现有方法有基于MapReduce的线性回归,其主要思想如下:使用Map进行读取所有训练数据,然后计算该训练数据与样本点的余弦距离,同时过滤掉不符合要求的值,然后输出相应的键值;在Combine阶段读取reduce函数的键值,并解析Map阶段计算好的距离,然后查找距离最近的K个数据点,并输出这K个数据点的键值;在Reduce阶段的工作与Combine阶段类似,同时需要选出K个数据点采用线性回归模型进行训练,并对测试数据进行预测,然后得到预测值并进行存储。
传统数据库和单节点预测分析技术主要缺点在于:传统数据库在进行海量数据汇总、排序时需要花费大量时间,且无法与数据进行实时交互。在单节点进行海量数据挖掘时耗费大量时间在数据读入内存过程中,并且迭代中产生的大量中间数据无法在内存中驻留,计算过程中需要反复读取中间数据,耗费系统资源和计算时间。在进行分袋、关联规则挖掘等需要一次性读入大规模数据运算时,单节点有限的内存空间无法进行数据读取,从而导致无法进行大规模数据的分析。
因此,在海量数据背景下,如何快速对电力数据进行处理,同时保证预测精度是本领域技术人员急需要解决的技术问题。
发明内容
为解决上述技术问题,本发明提供一种用电量预测方法,在海量数据背景下,快速对电力数据进行处理,同时保证预测精度。
为实现上述目的,本发明提供如下技术方案:
一种用电量预测方法,包括:
步骤S1:利用Spark平台读取原始用电量数据,并将所述原始用电量数据转换为弹性分布数据集;
步骤S2:提取所述弹性分布数据集的特征值,将所述弹性分布数据集按照预设比例划分为具有相同所述特征值的训练数据集以及测试数据集;
步骤S3:建立预测模型,将所述训练数据集代入所述预测模型,计算所述预测模型的模型参数;
步骤S4:将待预测数据作为变量输入至已代入所述模型参数的预测模型中,输出用电量预测值。
优选的,在上述用电量预测方法中,所述步骤S1中,所述用Spark平台读取原始用电量数据之后,还包括:
对所述原始用电量数据进行清洗、数据集成、数据变换和数据归约处理。
优选的,在上述用电量预测方法中,所述步骤S4之前,还包括:
重新将所述弹性分布数据集按照另一预设比例划分为具有相同所述特征值的训练数据集以及测试数据集;
将所述测试数据集输入所述预测模型中,优化所述模型参数,得到优化后的预测模型。
优选的,在上述用电量预测方法中,还包括:
将所述预测模型以及所述用电量预测值保存至分布式文件系统中。
优选的,在上述用电量预测方法中,所述步骤S3中,利用AdaBoost回归算法建立预测模型,生成AdaBoost回归预测模型。
本发明提供了一种用电量预测系统,包括:
读取模块,用于利用Spark平台读取原始用电量数据;
转换模块,用于将所述原始用电量数据转换为多个弹性分布数据集;
数据集划分模块,用于提取所述弹性分布数据集的特征值,将所述弹性分布数据集按照预设比例划分为具有相同所述特征值的训练数据集以及测试数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中电普华信息技术有限公司;国网信息通信产业集团有限公司;国家电网公司,未经北京中电普华信息技术有限公司;国网信息通信产业集团有限公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611178142.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人员活动轨迹的预测方法
- 下一篇:一种炼钢-连铸-热轧集成调度方法与系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理