[发明专利]一种用电行为分析方法有效
申请号: | 201910822271.8 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110674636B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 张忠东;唐国亮;谢辉;石少青;陈超;吴石松 | 申请(专利权)人: | 中国南方电网有限责任公司;南方电网数字电网研究院有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/2458;G06F16/28;G06N3/084;G06Q50/06 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用电 行为 分析 方法 | ||
1.一种用电行为分析方法,其特征在于,所述方法包括:
获取用电地址数据;
对所述用电地址数据进行数据特征提取及数据增强处理,并将处理后的用电地址数据输入至已训练的地址预处理模型,得到所述用电地址的分词和实体信息,所述已训练的地址预处理模型基于历史用电地址数据和分词和命名实体识别模型构建;
根据已训练的地址归一模型,对所述用电地址的分词和实体信息进行结构化处理和相似度计算,得出标准结构化地址;其中,所述已训练的地址归一模型的构建方式为:采集历史用电地址数据;对所述用电地址数据进行自然语言处理,得到层级地址信息;根据预设的层级地址结构化处理规则对所述层级地址信息进行处理;计算处理过的层级地址信息与预设基准地址的相似度,将相似权重最高的地址标记为归一地址,构建地址归一模型;
根据所述标准结构化地址,构建地址特征数据库;
根据预设的指标因素,计算所述地址特征数据库中各地址特征的权重;
根据所述权重,筛选出优选特征集;
基于所述优选特征集,采用聚类算法进行聚类分析,得到用电地址分类结果;
基于所述优选特征集和所述用电地址分类结果,采用关联分析算法进行挖掘分析,得出用电行为分析结果。
2.根据权利要求1所述的用电行为分析方法,其特征在于,所述将所述用电地址数据输入至已训练的地址预处理模型之前,还包括:
获取历史用电地址数据;
根据所述历史用电地址数据,构建训练集;
基于BERT预训练模型,对分词和命名实体识别模型进行参数优化,构建初始地址预处理模型;
基于所述训练集,采用Keras深度学习框架训练所述初始地址预处理模型,得到所述已训练的地址预处理模型。
3.根据权利要求2所述的用电行为分析方法,其特征在于,所述根据所述用电地址数据,构建训练集包括:
对所述用电地址数据进行可处理特征提取及分类,得到原始样本;
将所述原始样本中样本数较少的地址数据,按照预设的地址级别进行组合,构建样本库;
采用序列标注方法,对所述样本库中的数据进行分词和实体命名识别标注,构建训练集。
4.根据权利要求2所述的用电行为分析方法,其特征在于,所述基于所述训练集,采用Keras深度学习框架训练所述初始地址预处理模型包括:
将所述训练集输入所述初始地址预处理模型;
通过所述初始地址预处理模型的正向传播,计算所述训练集中各数据的得分;
将所述得分输入误差函数,计算所述得分与得分期望值的误差;
利用所述初始地址预处理模型进行反向传播,确定梯度向量;
根据所述梯度向量,更新所述初始地址预处理模型;
将所述训练集再次输入更新后的所述初始地址预处理模型,返回所述通过所述初始地址预处理模型的正向传播,计算所述训练集中各数据的得分的步骤,直至所述得分与得分期望值的误差达到最小,训练结束。
5.根据权利要求1所述的用电行为分析方法,其特征在于,所述用电地址数据主要包括电力用户的用户信息以及具体地址信息。
6.根据权利要求5所述的用电行为分析方法,其特征在于,所述用户信息包括用户类别,所述用户类别为居民、企业或公共设施。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国南方电网有限责任公司;南方电网数字电网研究院有限公司,未经中国南方电网有限责任公司;南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910822271.8/1.html,转载请声明来源钻瓜专利网。