[发明专利]一种数据预处理方法有效
申请号: | 202010041152.1 | 申请日: | 2020-01-15 |
公开(公告)号: | CN111291027B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 吴和俊;熊志刚;王敏康;陆宇宁;程田宝;胡驰远 | 申请(专利权)人: | 浙江华网恒业科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06Q50/06 |
代理公司: | 杭州汇和信专利代理有限公司 33475 | 代理人: | 周竑 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 预处理 方法 | ||
1.一种数据预处理方法,其特征在于,所述数据预处理方法用于对国家电网的电力杆塔、电力传输线路和电力传输通道做灾害风险预测前对采集的数据进行处理,包括如下步骤:采集历史信息,并对历史信息进行整理,形成完整的历史数据;
所述完整的历史数据具有若干维度,所述维度即为数据特征;
对完整的历史数据进行重采样,或对数据特征进行选择,得到训练集;
对历史信息进行整理,形成完整的历史数据具体包括:基于国家线网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;
对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;
对各个历史信息下缺失的数值子信息补充完整;
对各个历史信息下的非数值子信息进行独热编码;
独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。
2.根据权利要求1所述的数据预处理方法,其特征在于,采集历史信息包括:现场维修部门部署历史信息、杆塔及线路台账历史信息、气象历史信息;
现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;
气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。
3.根据权利要求1所述的数据预处理方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。
4.根据权利要求1所述的数据预处理方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。
5.根据权利要求1至4之一所述的数据预处理方法,其特征在于,所述灾害风险包括:覆冰灾害、雷击灾害、树线放电灾害、地质灾害以及机械外破灾害。
6.根据权利要求5所述的数据预处理方法,其特征在于,若做覆冰灾害或雷击灾害风险预测前对采集的数据进行处理,则对数据特征进行选择,得到训练集;若做树线放电灾害、地质灾害或机械外破灾害风险预测前对采集的数据进行处理,则对完整的历史数据进行重采样,得到训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江华网恒业科技有限公司,未经浙江华网恒业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010041152.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识库的构建方法及装置
- 下一篇:仓储作业方法、装置、可读介质及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置