[发明专利]基于深度学习的营配用数据自动聚类分析设备及方法在审
申请号: | 202010650325.X | 申请日: | 2020-07-08 |
公开(公告)号: | CN111898650A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 祝春捷;徐晓华;潘坚跃;周波;李强强;倪萍;杨阳;孔仪潇;谢赟;向新宇;雷云;王瑾;丁晖 | 申请(专利权)人: | 国网浙江省电力有限公司杭州供电公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/215;G06N3/04;G06N3/08;G06Q50/06 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 项军 |
地址: | 310000 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 营配用 数据 自动 聚类分析 设备 方法 | ||
本发明公开了一种基于深度学习的营配用数据自动聚类分析设备及方法,解决了现有技术的不足,方法包括预训练方法和微调方法,预训练方法首先将营配用数据输入预训练模块,然后预训练模块通过对营配用数据进行预训练构成预训练模型,微调方法首先读取预训练模型,然后加载营配用数据通过多次微调优化预训练模型构成最后自动聚类分析模型。
技术领域
本发明涉及智能电网技术领域,尤其是指一种基于深度学习的营配用数据自动聚类分析设备及方法。
背景技术
近年来,随着电力专业间的纵向贯通与横向融合进度不断加快,电力公司积极开展营配数据采录贯通工作,将变电站、公用配变、高压用户、低压表箱等营配信息与营业网点、计量库房等营销服务资源信息进行采录,实现了电网与客户信息的全覆盖。电网营配贯通后,产生了海量异构数据,这些数据对现有的分析与处理方法提出了新的挑战。一方面,具有海量、异构、多源、高维等特征的营配用数据导致传统数据分析方法无法直接适用;另一方面,营配用数据自身存在的数据质量低、挖掘手段匮乏造成了贯通后的应用困难。
中国专利公开号CN110766032A,公开日2020年2月7日,名称为《基于分层递进策略的配电网数据聚类集成方法》的发明专利中公开了一种配电网数据聚类集成方法,包括:生成配电网数据的备选聚类集合;基于分层递进的局部权重算法对所述备选聚类集合进行筛选获得基础聚类集合;通过层次聚类方法对所述基础聚类集合进行集成获得最后的集成聚类。不足之处在于,该专利的聚类方法较为简单,不能做到准确的数据聚类,数据质量仍然较低。
发明内容
本发明的目的是克服现有技术中营配用数据自身存在的数据质量低、挖掘手段匮乏造成了贯通后的应用困难的缺点,提供一种基于深度学习的营配用数据自动聚类分析设备及方法。
本发明的目的是通过下述技术方案予以实现:
一种基于深度学习的营配用数据自动聚类分析方法,包括预训练方法和微调方法,预训练方法首先将营配用数据输入预训练模块,然后预训练模块通过对营配用数据进行预训练构成预训练模型,微调方法首先读取预训练模型,然后加载营配用数据通过多次微调优化预训练模型构成最后自动聚类分析模型。
作为一种优选方案,所述的预训练方法的预训练模块为受限玻尔兹曼机,具体方法为:
步骤1,设置受限玻尔兹曼机各层节点数、迭代次数以及聚类个数;
步骤2,加载营配用数据,对数据进行清洗和归一化处理;
步骤3,将清洗后的数据作为输入,对玻尔兹曼机进行训练,得到各层权值,并保存;
步骤4,利用模糊C均值法对训练学习到的特征进行聚类并保存聚类结果,构成预训练模型。
作为一种优选方案,所述的微调方法具体为:
步骤5,读取预训练部分预训练模型的网络参数和初始聚类中心;
步骤6,加载营配用数据,对数据进行清洗和归一化处理;
步骤7,设置最大微调次数和循环初值;
步骤8,利用批量梯度下降法对目标函数进行迭代寻优,直至迭代停止。
作为一种优选方案,所述的步骤2中,对数据进行清洗的具体方法为:获取营配用数据的误报样本,然后对误报样本所对应的营配用数据进行数据清洗。
作为一种优选方案,判断误报样本的方法具体为:受限玻尔兹曼机的营配用数据设有期望数据,加载营配用数据后,输出得到实际输出数据,将实际输出数据和期望数据进行对比,如果存在差异则判断为误报样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司杭州供电公司,未经国网浙江省电力有限公司杭州供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010650325.X/2.html,转载请声明来源钻瓜专利网。