[发明专利]一种面向智能电网的缺失数据填充方法在审
申请号: | 201410344391.9 | 申请日: | 2014-07-18 |
公开(公告)号: | CN104133866A | 公开(公告)日: | 2014-11-05 |
发明(设计)人: | 祁建;周红林;王青国 | 申请(专利权)人: | 国家电网公司;江苏省电力公司;江苏电力信息技术有限公司;江苏省电力公司信息通信分公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种面向智能电网的缺失数据填充方法,首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D;然后将重新生成的数据集D分成两部分,即完整数据子集Dc和缺失数据子集Di,并对完全数据集D进行聚类;最后通过聚类结果对缺失数据子集Di进行填充,得到填充结果Di’。本发明能够在存在噪声和离群点的情况下,有效聚类空间数据,将其应用于缺失值填充中,提升了数据填充的准确性,为电力公司实现对业务系统数据的智能管理奠定了基础。 | ||
搜索关键词: | 一种 面向 智能 电网 缺失 数据 填充 方法 | ||
【主权项】:
一种面向智能电网的缺失数据填充方法,其特征在于:首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D,D由完整数据子集Dc和缺失数据子集Di构成;然后对D进行聚类,形成N个紧密耦合的簇;最后根据聚类结果对缺失数据子集Di进行填充,得到填充结果Di’,具体步骤如下:1)将源系统数据集中的部分不完整数据打回让源系统重新生成,这些数据包含有较多缺失值的记录和较少完整值的属性;通常情况下如果一条记录的缺失属性值占记录全部属性值的一半及以上需要打回该记录;如果某个属性的完整属性值占全部记录的比例低于50%,也需要打回该属性;2)对重新生成的数据集D将重新生成的数据集分成完整数据子集Dc和缺失数据子集Di,并对D进行K‑Means聚类,从而产生紧密耦合的K个小簇,这些小簇能够将噪声和离群点与其他点有效地分离开来,然后通过动态合并的方式不断地合并这些小簇,在D上产生N个紧密耦合的簇;3)根据聚类后的结果对缺失数据子集进行填充,在填充过程中,如果簇中含有完整属性的数据,利用该簇相应的属性均值来填充该记录的缺失值;如果簇中没有完整属性的数据,则根据完整数据子集Dc的平均值和方差,基于正态分布数据分发器来对这些缺失值进行填充。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;江苏省电力公司;江苏电力信息技术有限公司;江苏省电力公司信息通信分公司,未经国家电网公司;江苏省电力公司;江苏电力信息技术有限公司;江苏省电力公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410344391.9/,转载请声明来源钻瓜专利网。
- 上一篇:软件标签的生成方法和装置
- 下一篇:一种广告过滤方法以及装置