[发明专利]一种数据清洗方法和装置在审
申请号: | 202010905695.3 | 申请日: | 2020-09-01 |
公开(公告)号: | CN112069161A | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 叶楠;周羲和;惠新标 | 申请(专利权)人: | 上海佰贝科技发展股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 谢绪宁;薛赟 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 清洗 方法 装置 | ||
本申请涉及一种数据清洗方法和装置,方法包括获取多个归属于同一场景下的第一数字信号信息,这些第一数字信号信息分别来自一个或者多个信息采集端的一个或者多个轮询区间;对每第一数字信号信息进行解析,得到待清洗数据群信息,待清洗数据群信息中包含多个第二信号信息,至少有一个第二信号信息的频率特征与其他第二信号信息的频率特征是不同的;取根据场景构建的清洗规则信息以及根据清洗规则信息对待清洗数据群信息进行清洗,得到结果数据群信息,结果数据群信息中包含一个或者多个第二信号信息。本申请用于物联网数据的清洗,有助于提高清洗效果。
技术领域
本申请涉及数据处理的技术领域,尤其是涉及一种数据清洗方法和装置。
背景技术
传统的大数据采集数据的时候,数据来自于人工数据,清洗时需要处理的问题主要是数据的失效和错漏,而物联网数据有数据采集于自然状况,混合有噪声及线性或非线性失真。传统的数据清洗方法主要是基于统计模型,针对人工数据可行,但是并不适用于物联网数据的清洗。
发明内容
本申请提供一种数据清洗方法和装置,有助于提高对物联网数据的清洗效果。
本申请的上述目的是通过以下技术方案得以实现的:
第一方面,本申请提供了一种数据清洗方法,包括:
获取多个归属于同一场景下的第一数字信号信息,这些第一数字信号信息分别来自一个或者多个信息采集端的一个或者多个轮询区间;
对每第一数字信号信息进行解析,得到待清洗数据群信息,待清洗数据群信息中包含多个第二信号信息,至少有一个第二信号信息的频率特征与其他第二信号信息的频率特征是不同的;
获取根据场景构建的清洗规则信息;以及
根据清洗规则信息对待清洗数据群信息进行清洗,得到结果数据群信息,结果数据群信息中包含一个或者多个第二信号信息。
通过采用上述技术方案,将第一数字信号转换为以频率特征为基础的第二信号,然后根据清洗规则进行清洗,相比于基于统计模型的筛选方式,这种筛选方式可以迅速确定所需要的数据。
在第一方面的一种可能的实现方式中,对清洗数据群信息进行多次清洗,每次使用的清洗规则信息是不同的。
通过采用上述技术方案,使用多次清洗的方式对获取到第一数字信号信息进行清洗,这种清洗方式可以根据实际的清洗需求制定合适的清洗规则,得到所需要的数据。
在第一方面的一种可能的实现方式中,对于属于同一场景下的来自不同信号采集端的第二信号信息,通过其在时间域、空间域和/或频率域上的关联性进行清洗。
通过采用上述技术方案,可以通过在时间、空间和频率上的关联性对第二信号信息进行清洗,清洗规则更加的多样化,有助于提高清洗效果。
在第一方面的一种可能的实现方式中,对于属于同一场景下的来自相同信号采集端的第二信号信息,通过其在时间域、空间域和/或频率域上的关联性进行清洗。
通过采用上述技术方案,可以通过在时间、空间和频率上的关联性对第二信号信息进行清洗,清洗规则更加的多样化,有助于提高清洗效果。
在第一方面的一种可能的实现方式中,所述清洗的方式包括去除和/或范围选择。
通过采用上述技术方案,可以将需要的第二信号信息挑出来或者将不用的第二信号信息去除,清洗的方式更加灵活。
在第一方面的一种可能的实现方式中,所述清洗规则信息包括噪声模型信息、干扰模型信息和/或期望信号模型信息。
通过采用上述技术方案,将清洗规则进行了模块化处理,方便根据实际的需求进行定制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海佰贝科技发展股份有限公司,未经上海佰贝科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010905695.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:减振装置、压缩机以及电器
- 下一篇:一种桥梁桩基础结构及其施工方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置