[发明专利]一种数据预处理方法有效

专利信息
申请号: 202010041152.1 申请日: 2020-01-15
公开(公告)号: CN111291027B 公开(公告)日: 2023-08-15
发明(设计)人: 吴和俊;熊志刚;王敏康;陆宇宁;程田宝;胡驰远 申请(专利权)人: 浙江华网恒业科技有限公司
主分类号: G06F16/215 分类号: G06F16/215;G06Q50/06
代理公司: 杭州汇和信专利代理有限公司 33475 代理人: 周竑
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 预处理 方法
【权利要求书】:

1.一种数据预处理方法,其特征在于,所述数据预处理方法用于对国家电网的电力杆塔、电力传输线路和电力传输通道做灾害风险预测前对采集的数据进行处理,包括如下步骤:采集历史信息,并对历史信息进行整理,形成完整的历史数据;

所述完整的历史数据具有若干维度,所述维度即为数据特征;

对完整的历史数据进行重采样,或对数据特征进行选择,得到训练集;

对历史信息进行整理,形成完整的历史数据具体包括:基于国家线网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;

对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;

对各个历史信息下缺失的数值子信息补充完整;

对各个历史信息下的非数值子信息进行独热编码;

独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。

2.根据权利要求1所述的数据预处理方法,其特征在于,采集历史信息包括:现场维修部门部署历史信息、杆塔及线路台账历史信息、气象历史信息;

现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息;

气象历史信息包括天气状况子信息、气温子信息、湿度子信息、风速子信息、风向子信息。

3.根据权利要求1所述的数据预处理方法,其特征在于,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。

4.根据权利要求1所述的数据预处理方法,其特征在于,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。

5.根据权利要求1至4之一所述的数据预处理方法,其特征在于,所述灾害风险包括:覆冰灾害、雷击灾害、树线放电灾害、地质灾害以及机械外破灾害。

6.根据权利要求5所述的数据预处理方法,其特征在于,若做覆冰灾害或雷击灾害风险预测前对采集的数据进行处理,则对数据特征进行选择,得到训练集;若做树线放电灾害、地质灾害或机械外破灾害风险预测前对采集的数据进行处理,则对完整的历史数据进行重采样,得到训练集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江华网恒业科技有限公司,未经浙江华网恒业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010041152.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top