[发明专利]基于窗口的流式数据缺失处理方法有效

专利信息
申请号: 201810215615.4 申请日: 2018-03-15
公开(公告)号: CN108650065B 公开(公告)日: 2021-09-10
发明(设计)人: 沈中;秦超;杨清海 申请(专利权)人: 西安电子科技大学
主分类号: H04L1/18 分类号: H04L1/18;H04L12/807;G06K9/62
代理公司: 西安长和专利代理有限公司 61227 代理人: 黄伟洪
地址: 710071 陕西省*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 窗口 数据 缺失 处理 方法
【权利要求书】:

1.一种基于窗口的流式数据缺失处理方法,其特征在于,所述基于窗口的流式数据缺失处理方法通过对流式数据提供滑动窗口,根据数据流的大小动态调整窗口大小;利用数据内部的时间和空间特性对缺失数据进行填补,实现流式数据的缺失填补;

所述基于窗口的流式数据缺失处理方法包括以下步骤:

步骤一,输入数据流;

步骤二,选取初始窗口大小,判断窗口中的数据是否缺失;窗口大小选取和数据流数据缺失判断方法具体包括:

初始窗口大小的选取根据数据流入速率进行设置,然后读取窗口中的数据,如果存在缺失则进行下一步处理,如果不存在缺失则进行窗口滑动,滑动大小为当前窗口大小;

步骤三,滑动窗口大小调整;计算饱和可用窗口大小Wmax;计算当前窗口Wcur大小,计算数据为空的子窗口NSWnull大小;调整窗口大小;动态滑动窗口评估方法具体包括:

(1)当前窗口Wcur大小计算,采用最大饱和可用窗口Wmax的一定比例来获取得;

(2)调整窗口大小的方法,保持η的大小在0.8-0.9的范围内波动,然后动态调整SW的大小,当窗口占比增大到0.9则减小Wcur的大小,否则当窗口占比减小到0.8则增大Wcur的大小,其中表示数据窗口占比,SW为窗口大小;

步骤四,窗口锁定,保持窗口大小并存储窗口中的数据;

步骤五,进行不完备信息处理,判断数据是部分缺失还是整体缺失;是部分缺失判断是位置信息缺失还是信号信息缺失,或者两部分都缺失,利用算法填充;全部缺失,判断是什么情况缺失,利用算法填充;

所述步骤五位置信息部分缺失的填充方法采用差值法填充,任意第i项数据与第j项数据之间的相关性采用数据相关性公式计算,可以采用但不仅限于如下计算公式:

其中:j=1,2,...,i-1,i+1,...,n;yik代表第i条数据项的第k个属性值,yjk代表第j条数据的第k个属性值;yi代表第i数据项的平均值,yj代表第j条数据项的平均值;

所述步骤五缺失类型判断方法具体如下:

在读取窗口中的数据时,根据数据帧的情况,在读取到缺失数据位以后,根据缺失部分位于数据帧中的位置来判断具体缺失情况;

信号信息部分缺失情况方法采用空间最近邻方法具体包括:对各个传感器节点找到自己空间相关的节点信息,保存在本身的信息存储单元中;找到缺失数据节点的缺失数据项,相邻的空间相关性节点的相同或相近的时刻点的数据项,对数据项进行求均值,把结果填充到缺失的数据位;

所述步骤五特征全部缺失情况采用如下步骤:

(1)位置信号全而信号信息缺失,对缺失信息不处理,直接输出;

(2)信息中的信号信息是全的,位置信息全部缺失,采用灰度预测方法进行填充;

(3)位置信息全部缺失时,并存在信号信息缺失的情况,对信息无法进行处理的,丢弃数据;

步骤六,输出完备数据流。

2.一种应用权利要求1所述基于窗口的流式数据缺失处理方法的无线通信系统。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810215615.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top