[发明专利]一种基于用户行为的用电数据特征提取方法及系统在审
申请号: | 202110720759.7 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113743977A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 朱征;田英杰;苏运;郭乃网;吴裔;李凡;赵莹莹;阮静娴;金妍斐;沈泉江;冯楠;杨洪山;吴元庆 | 申请(专利权)人: | 国网上海市电力公司;星环信息科技(上海)股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/06;G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 丁云 |
地址: | 200122 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 行为 用电 数据 特征 提取 方法 系统 | ||
本发明涉及一种基于用户行为的用电数据特征提取方法及系统,所述方法包括以下步骤:S1:获取用户用电数据;S2:对用户用电数据进行基于BIC的特征选择,获取用户用电数据的参数重要性排序,并确认特征选择结果;S3:根据选择的特征进行一次聚类,获取一次聚类结果;S4:对一次聚类结果的不同类型分别进行第二次聚类,获取用电数据特征。与现有技术相比,本发明提高聚类结果的可靠性和准确性,实现用户用电数据特征的有效提取,可以准确发现用电高峰。
技术领域
本发明涉及电力大数据领域,尤其是涉及一种基于用户行为的用电数据特征提取方法及系统。
背景技术
随着智能电网、物联网和云计算等技术的迅猛发展,电力部门成为大数据的重要生产部门,其发、输、配、售各个环节都产生大量高频数据,为提升电力供应的安全稳定性、提高可再生能源的接入比例、强化需求侧管理等需求提供了新的技术手段。
了解不同用户的用电行为,发现在不同应用场景中有特殊价值的用户群,进而为配用电方面的管理和决策提供依据。但是用户的社会属性、行为偏好等的多样性导致了用户用电行为的复杂性,这使得精确的用户用电的管理和需求响应非常困难。以往的研究主要基于行为科学与社会实验方法、利用各类离散选择模型对居民用电行为的偏好特征进行研究,在用电行为的动因研究方面往往基于消费者行为理论,利用各种时间序列和面板数据模型。这种分析中所使用的数据量偏小、数据指标偏宏观和片面,数据获取的难度很大,这使得分析结果往往只能给出区域性的、长期的用户行为偏好,无法对每个用户进行分类分析,给出微观尺度高频结果,更无法给出短期甚至实时的用户反馈。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于用户行为的用电数据特征提取方法及系统。
本发明的目的可以通过以下技术方案来实现:
一种基于用户行为的用电数据特征提取方法,包括以下步骤:
S1:获取用户用电数据;
S2:对用户用电数据进行基于BIC的特征选择,获取用户用电数据的参数重要性排序,并确认特征选择结果;
S3:根据选择的特征进行一次聚类,获取一次聚类结果;
S4:对一次聚类结果的不同类型分别进行第二次聚类,获取用电数据特征。
优选地,所述的基于BIC的特征选择中的BIC模型的表达式为:
BIC=2*lnN*p-2*lnφ
其中,BIC为参数的BIC值,p为模型参数个数,N为用户用电数据样本数量,φ为似然函数。
优选地,所述的用户用电数据的参数包括最高温、日最低负荷、日最高负荷、日平均负荷、最低温、天气、日类型、风力。
优选地,所述的步骤S2中按照参数重要性从大到小选取多个用户用电数据参数作为特征选择结果。
优选地,所述的一次聚类采用K-means算法进行聚类,其相似性度量使用欧氏距离。
优选地,所述的二次聚类采用凝聚层次聚类算法进行聚类。
一种基于用户行为的用电数据特征提取系统,包括以下模块:
数据获取模块,用于获取用户用电数据;
特征选择模块,用于对用户用电数据进行基于BIC的特征选择,获取用户用电数据的参数重要性排序,并确认特征选择结果;
一次聚类模块,用于根据选择的特征进行一次聚类,获取一次聚类结果;
二次聚类模块,用于对一次聚类结果的不同类型分别进行第二次聚类,获取用电数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;星环信息科技(上海)股份有限公司,未经国网上海市电力公司;星环信息科技(上海)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110720759.7/2.html,转载请声明来源钻瓜专利网。