[发明专利]一种基于大数据的网络数据采集系统有效
申请号: | 202011205005.X | 申请日: | 2020-11-02 |
公开(公告)号: | CN112507208B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 王斌;董伟;李孟 | 申请(专利权)人: | 北京迅达云成科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/18;G06F16/215;G06K9/62 |
代理公司: | 北京广技专利代理事务所(特殊普通合伙) 11842 | 代理人: | 张国香 |
地址: | 100000 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 网络 采集 系统 | ||
1.一种基于大数据的网络数据采集系统,其特征在于,包括:
采集模块,用于在第N个周期内,采集预设采集数量的网络数据;
均值及方差计算模块,用于计算并记录第N个周期内采集的网络数据的均值和方差;
第一更新模块,用于根据第N-1个周期、第N个周期内采集的网络数据的均值和方差,更新第N+1个周期的时长;
其中,N为不小于2的正整数,第1个周期的时长为预设初始值;
其中,所述网络数据采集系统还包括:
第一判断模块,用于判断N是否大于等于指定数量,是则触发第二判断模块工作,否则触发第一更新模块更新第N+1个周期的时长;
第二判断模块,用于根据第j个周期到第N个周期的各周期时长,判断第N个周期的时长变化是否超过预定标准,是则触发第一更新模块更新第N+1个周期的时长,否则触发第二更新模块更新第N+1个周期的时长;其中,j为大于等于1且小于N的正整数,且N-j+1=M,M为所述指定数量;
第二更新模块,用于根据所述第j个周期到第N个周期的时长以及这些周期内采集的网络数据的均值和方差,更新第N+1个周期的时长。
2.如权利要求1所述的基于大数据的网络数据采集系统,其特征在于,所述第二判断模块,包括:
时长方差计算单元,用于计算所述第j个周期到第N个周期的时长方差;
判断单元,用于判断所述时长方差是否大于预设阈值,是则确定第N个周期的时长变化超过预定标准,否则确定第N个周期的时长变化未超过预定标准。
3.如权利要求1或2所述的基于大数据的网络数据采集系统,其特征在于,所述第二更新模块,具体用于根据以下公式更新第N+1个周期的时长:
其中,TN+1为第N+1个周期的时长,Ti为第i个周期的时长,Wi为第i个周期的权重,为第i个周期内采集的网络数据的均值,Si为第i个周期内采集的网络数据的方差,其中i=j,…,N。
4.如权利要求3所述的基于大数据的网络数据采集系统,其特征在于,所述第二更新模块更新第N+1个周期的时长时使用的各个周期的权重值为1/M。
5.如权利要求3所述的基于大数据的网络数据采集系统,其特征在于,所述第二更新模块更新第N+1个周期的时长时使用的各个周期的权重值为:
其中,Z为使得成立的实数。
6.如权利要求1所述的基于大数据的网络数据采集系统,其特征在于,所述采集模块包括:
数据预处理单元,用于对采集的网络数据进行分类,将网络数据分为非噪声数据与噪声数据;
数据过滤单元,用于获取所述噪声数据中符合预设噪声标准的目标噪声数据与非噪声数据中的有效数据,对所述目标噪声数据进行修正处理,并将所述修正处理后的目标噪声数据与所述有效数据合成目标网络数据,再将所述目标网络数据存入数据库;
数据输出单元,用于将所述数据库中的所述目标网络数据输出至均值及方差计算模块;
其中,所述数据过滤单元,具体用于根据以下步骤对所述目标噪声数据进行修正处理:
步骤B1:所述数据过滤单元通过如下公式计算所述目标噪声数据对应的修正误差因子:
其中,μ1为所述目标噪声数据对应的修正误差因子,C为预设的常数,C取值范围为(0,10),m为所述目标噪声数据的数量,为预设的所述目标噪声数据的偏置,取值为(0,1);Yk为第k个目标噪声数据与所述预设噪声标准之间的匹配度,Ymax为所述m个目标噪声数据中与所述预设噪声标准之间的匹配度的最大值;
步骤B2:所述数据过滤单元根据计算的所述修正误差因子,通过如下公式计算所述目标噪声数据的修正误差值QZ:
步骤B3:所述数据过滤单元根据如下公式计算每个目标噪声数据对应的修正匹配度Y0k:
当第k个目标噪声数据的Yk等于或大于预设阈值时,采用如下公式计算第k个目标噪声数据的修正匹配度Y0k:
Y0k=Yk(1-QZ)
当第k个目标噪声数据的Yk小于所述预设阈值时,采用如下公式计算第k个目标噪声数据的修正匹配度Y0k:
Y0k=Yk(1+QZ)
步骤B4:针对每个目标噪声数据:
当当前目标噪声数据的修正匹配度等于或大于所述预设阈值时,保留所述当前目标噪声数据;
当当前目标噪声数据的修正匹配度小于所述预设阈值时,剔除所述目标噪声数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迅达云成科技有限公司,未经北京迅达云成科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011205005.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置