[发明专利]基于有监督和无监督算法结合的负荷曲线数据可视化方法在审
申请号: | 201910481049.6 | 申请日: | 2019-06-04 |
公开(公告)号: | CN110321390A | 公开(公告)日: | 2019-10-11 |
发明(设计)人: | 林顺富;顾乡;刘持涛;颜昕昱 | 申请(专利权)人: | 上海电力学院 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06N3/04;G06Q10/06;G06Q50/06 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200090 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 负荷曲线 无监督 算法结合 负荷曲线数据 标签数据 可视化 神经网络分类器 神经网络学习 相似性度量 支持向量机 自动编码器 初始参数 计算效率 监督分类 聚类算法 类别标签 曲线形态 权值矩阵 神经网络 大数据 隐藏层 优化谱 分类 监督 稀疏 尺度 优化 改进 | ||
本发明涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,首先,基于距离与曲线形态的双尺度相似性度量,采用无监督优化谱聚类算法获得负荷曲线精准标签数据;其次,采用稀疏自动编码器神经网络学习大规模待分类负荷曲线的内在特征,得到隐藏层权值矩阵即神经网络的优化初始参数;最后,基于已获得的标签数据,训练支持向量机神经网络分类器,实现对大规模待分类负荷曲线的有监督分类。有监督与无监督算法结合能够获得更精确的负荷曲线类别标签数据并一定程度上改进大数据导致的计算效率较低问题。
技术领域
本发明涉及智能电网用户侧负荷数据处理方法,尤其是涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。
背景技术
随着电网用户侧对电能使用多方面要求的提升,社会逐渐暴露出资源短缺等问题。为应对能源短缺问题,国家在接入高比例可再生能源的同时,进一步开放售电市场,使得用户在用电选择上具有更多的自由性。由此带来的用户端的高自由度导致负荷曲线更加趋于多样化。用户用电行为在季节、时段等方面存在一定的潜在规律。采用聚类或分类技术对负荷曲线进行分析,是详细了解用户用电特征的重要手段。电力负荷曲线分类是需求侧管理、负荷建模等工作的重要基础,对电力系统的分析、运行、规划都具有重要意义。
电力负荷曲线分类方法主要有无监督、有监督,以及无监督和有监督结合等方法。负荷曲线无监督分类主要采用基于划分的k-means和模糊C均值聚类、层次聚类、自组织映射聚类等方法。面对当今智能电网大数据场景下电力负荷曲线数量繁多、形态差异显著等问题,较广泛应用的划分式聚类算法仅以单一的传统距离量度方式判断负荷曲线相似度难以有效区分形态差异较大的负荷曲线。负荷数据维数越高,平均距离这一测度的意义就越小。因此,考虑引入皮尔逊相关系数代替欧氏距离判据改善负荷形态聚类效果,但仅能识别出幅度不同形态相似的负荷曲线。还有学者提出一种以余弦相似度作为外层聚类判据,欧式距离作为内层聚类判据的双层聚类分析方法,一定程度上可以有效识别出负荷类型。但是,现有文献大多仅针对距离的相似性度量函数进行优化,并未综合考虑负荷曲线形态特征相似度,因此导致聚类效果并不理想。
负荷曲线有监督分类主要采用基于统计原理的最小距离分类、贝叶斯分类,以及基于人工神经网络的分类等方法。其中,人工神经网络因为其自主学习能力强,容错性能良好等特点应用更为广泛。采用Kohonen神经网络对负荷动态特性进行聚类,验证该神经网络应用于负荷分类的优越性;采用BP神经网络学习负荷动态特性,但BP神经网络的解受训练样本影响较大,这个不足限制了BP神经网络的广泛应用。神经网络的在目前的研究中还存在着训练样本过大导致分类效率低下、训练过程中出现过拟合等问题。
鉴于无监督和有监督分类方法存在的问题,近年来有学者提出采用无监督与有监督相结合的负荷曲线分类方法。利用无监督算法获取标签数据,作为有监督分类算法的训练样本。将无监督算法的复杂度低、适用性强与有监督算法的效率高、描述复杂动态行为效果好等优势相结合。将模糊C均值聚类或k-means聚类与神经网络相结合,一定程度上能够提高海量数据处理效率。但是,现有文献在获取标签数据环节一般仅考虑距离相似度判据,获得的标签数据精准较低,对最终的分类结果会造成一定的影响。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。
本发明的目的可以通过以下技术方案来实现:
一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,该方法包括以下步骤:
步骤1:针对输入的用户用电负荷曲线数据通过误差平方和(sum of squarederror,SSE)确定最优聚类数;
步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;
步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力学院,未经上海电力学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910481049.6/2.html,转载请声明来源钻瓜专利网。