[发明专利]一种基于聚类特征树和离群度量化的散乱污企业研判方法有效
申请号: | 202110156908.1 | 申请日: | 2021-02-04 |
公开(公告)号: | CN112800148B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 邓勇;李宏发;陈吴晓;陈行滨;乐艺泽;黄锐;熊军;李霄铭;余翔;陈汉城;何纪元;林旭军;冷正龙;杨启帆;杨劲怀;王栋;吴茜;谢景宇;林灵婷;丁宁;林嘉 | 申请(专利权)人: | 国网福建省电力有限公司;国网福建省电力有限公司信息通信分公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06K9/62;G06Q50/06;G06Q50/26 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350003 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 离群 度量 散乱 企业 研判 方法 | ||
本发明涉及一种基于聚类特征树和离群度量化的散乱污企业研判方法。该方法包括:收集企业一个月内包括每日用电量、谷时用电量、峰时用电量、平时用电量的历史用电数据进行预处理并构建企业用电特征;根据企业用电特征,通过计算聚类特征统计量构建聚类特征树模型;通过聚类特征的稠密度和节点深度计算离群度,并在剪枝和重构过程中对数据离群度进行调整;使用聚类特征树的叶子节点进行聚类,通过离群度的感染传播确定更新数据离群度,作为散乱污企业研判的依据。本发明解决了传统基于统计学的方法中对特征利用的不充分,解决了聚类方法需要人工对聚类结果进行分析研判的问题,同时增加了模型的鲁棒性和可延展性。
技术领域
本发明涉及电力大数据用于环保散乱污管控的分析方法技术领域,尤其涉及一种基于聚类 特征树和离群度量化的散乱污企业研判方法。
背景技术
随着人工智能研究和应用的快速发展,各种高效的机器学习模型被应用到各个领域。针对 类似“散乱污”检测问题的方法,可以抽象为离群点检测问题。现有的离群点检测方法主要包 括根据数据分布信息研判的统计学方法、基于近邻性的离群点检测和基于聚类的离群点检测。 基于统计学的方法主要包括基于正态分布的一元离群点检测、使用马哈拉诺比斯距离的多元离 群点检测、使用混合参数分布和期望最大化算法的参数估计法。基于近邻性的离群点检测主要 包括基于距离阈值的离群点检测和基于密度的离群点检测。基于聚类的离群点检测主要包括局 部离群点因子检测算法及其改进算法。
对于基于统计学的离群点检测方法在“散乱污”检测问题中应用的主要问题为:源数据为 企业的用电数据,单纯使用数据分布的统计信息只能反映用电的总体情况,对企业本身的用电 特征利用较少,对用电异常的企业检测无法达到很理想的效果;基于近邻性的的离群点检测方 法主要针对全局离群点或者局部离群点,对较为复杂的情况缺乏鲁棒性;基于聚类的解决方案 考虑将具有不同特征的数据点划分到不同的区域,但是没有一个确定的指标来确定各个区域的 离群程度,需要一定程度的人工干预才能完成离群检测。
为克服以上建模方法的不足,在保留高维统计学信息的前提下,利用聚类方法对有相似特 征的数据进行归类,并结合企业用电数据、用电量变化趋势和各时段用电量比值的特征,基于 聚类特征树模型对各个数据点的离群程度进行量化,作为“散乱污”企业的研判标准。
发明内容
本发明的目的在于提供一种基于聚类特征树和离群度量化的散乱污企业研判方法,解决了 传统基于统计学的方法中对特征利用的不充分,解决了聚类方法需要人工对聚类结果进行分析 研判的问题,同时增加了模型的鲁棒性和可延展性。
为实现上述目的,本发明的技术方案是:一种基于聚类特征树和离群度量化的散乱污企业 研判方法,包括如下步骤:
步骤S1、收集企业一个月内包括每日用电量、谷时用电量、峰时用电量、平时用电量的历 史用电数据进行预处理并构建企业用电特征;
步骤S2、根据企业用电特征,通过计算聚类特征统计量构建聚类特征树模型;
步骤S3、通过聚类特征的稠密度和节点深度计算离群度,并在剪枝和重构过程中对数据离 群度进行调整;
步骤S4、使用聚类特征树的叶子节点进行聚类,通过离群度的感染传播确定更新数据离群 度,作为散乱污企业研判的依据。
在本发明一实施例中,步骤S1中,对历史用电数据进行预处理并构建企业用电特征过程, 包括对企业用电量中包括重复、不完整的不可用数据进行清洗,通过计算每日用电量差值和谷 峰比,量化用电量变化程度和用电时间特征;其中,
谷峰比计算规则为:
其中vi表示第i天谷时用电,ui表示第i天平时用电,pi表示第i天峰时用电,ri表示第i 天谷峰比;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网福建省电力有限公司;国网福建省电力有限公司信息通信分公司,未经国网福建省电力有限公司;国网福建省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110156908.1/2.html,转载请声明来源钻瓜专利网。