[发明专利]一种电力营销缺失数据补全方法在审
申请号: | 201410758328.X | 申请日: | 2014-12-10 |
公开(公告)号: | CN104392400A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 吉涛;慕福林;翁亚利;谭元刚;王刚;赵莉;傅宏;张向东;郑迎春;邱小平;孔维禅;孙渊;刘虓豪 | 申请(专利权)人: | 国家电网公司;国网重庆市电力公司客户服务中心;重庆小目科技有限责任公司 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 盛元坤 |
地址: | 100081*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种电力营销缺失数据补全方法。基于电力数据在采集过程中的大量缺失问题进行分析,在对比一般贝叶斯方法和双尺度贝叶斯方法后,对方法进行了综合改进,使其适应于关联关系较弱、而独立性较强的电力营销数据中。同时将该算法用于数据集中进行测试,效果具有一定的提高。后续需要在营销系统中进行海量数据应用,使补全的数据能满足进一步营销数据挖掘。 | ||
搜索关键词: | 一种 电力 营销 缺失 数据 方法 | ||
【主权项】:
一种电力营销缺失数据补全方法,其特征在于:1)采集电力营销数据,并将这些数据保存在数据集中,所述数据集中有N个记录,每个记录有M个属性;数据集中任意一个纪录记为记录x,x为纪录的序列号,取值为自然数;记录x的属性分别为X1,……,XM;令c1,...,cL是Xi样本空间的划分,i=1、2……m;属性Xi的分类个数为Li;Ni代表了包含已知Xi属性的记录个数;当Xi等于它的第K个分类时,cik的记录的个数设为Nik;Njr|ik是当Xj等于它的第r个分类cjr的记录的个数;2)计算纪录x的属性Xi缺失概率:P(ck/X)':计算每一个属性的先验概率:P(Xi=cik)=Nik/Nii=1,...,M;k=1,...,Li计算当Xi=cik时,属性Xj的后验概率:P(Xj=cjr|Xi=cik)=Njr|ik/Nikj=1,...,M;j≠i;r=1,...,Lj当记录x的属性Xi存在一个缺失时,令J为x的非缺失数据索引;当Xi=cik:时,计算XJ条件概率,在此表示为修正因子:θ=P(XJ|Xi=cik)=NJ|ik/Nik,XJ=X1∩X2∩……Xj∩……∩XM;j≠i后验概率P1的计算公式如下: 后验概率P2的计算公式如下: 最终计算公式为:P(ck/X)'=P1+(P2‑P1)*θ3)当计算出缺失概率后,采用最大概率填充法、概率分布填充法或权值填充法,进行缺失数据填充。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网重庆市电力公司客户服务中心;重庆小目科技有限责任公司,未经国家电网公司;国网重庆市电力公司客户服务中心;重庆小目科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410758328.X/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置