[发明专利]一种数据检测的方法及装置在审
申请号: | 201611129422.4 | 申请日: | 2016-12-09 |
公开(公告)号: | CN106844423A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 黄辉 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 胡彬,邓猛烈 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 检测 方法 装置 | ||
技术领域
本发明实施例涉及数据检测技术,尤其涉及一种数据检测的方法及装置。
背景技术
随着互联网技术的革新,大数据开始蔓延至各个行业和领域,影响着人们的知识体系和生活方式。如何利用大数据激发和利用隐藏于数据内部未被发掘的价值,是当下研究的热门话题。
由于数据流较长,在数据分析处理或传输过程中,易存在数据丢失的情况,对数据挖掘等产生不良影响。现有技术通常做法是在技术人员质疑数据丢失时,采用人工定位的方式判断数据是否丢失,并对丢失环节进行大致的判断,判断结果准确度依赖于技术人员的经验,检测效率低。
发明内容
本发明实施例提供一种数据检测的方法及装置,以实现对数据丢失环节进行判断,提高检测效率。
第一方面,本发明实施例提供了一种数据检测的方法,该方法包括:生成至少一个处理环节的数据记录,所述数据记录包括每个处理环节的起始数据量和生成数据量;
根据所述至少一个处理环节对应的起始数据量和生成数据量确定数据丢失信息。
进一步地,所述处理环节包括数据生成子环节和数据处理子环节,所述生成至少一个处理环节的数据记录,包括:
在第一处理环节的数据生成子环节的起始时刻,将所述数据生成子环节的起始时刻和接收到的起始数据量记录到统计日志,所述第一处理环节为任意一个处理环节;
在所述数据生成子环节的结束时刻,将所述数据生成子环节的结束时刻和第一生成数据量记录到所述统计日志;
在所述数据处理子环节的结束时刻,将所述数据处理子环节的结束时刻和第二生成数据量记录到所述统计日志;
相应的,所述根据所述至少一个处理环节对应的起始数据量和生成数据量确定数据丢失信息,包括:
通过统计日志中接收数据总量、第一生成数据量和第二生成数据量,确定所述第一处理环节中的数据丢失信息。
进一步地,所述根据所述至少一个处理环节对应的起始数据量和生成数据量确定数据丢失信息,包括:
获取具有相同数据生成子环节的起始时刻的目标处理环节;
根据目标处理环节对应的起始数据量和生成数据量确定数据丢失信息;
相同数据生成时间的数据的丢失所在的环节。
进一步地,所述数据处理子环节对应的数据处理操作包括数据清洗、数据去重、数据归一化或标记数据标签中的是至少一种。
进一步地,所述处理环节包括格式转换环节、数据存入数据库环节或业务系统展示环节中的至少一个。
第二方面,本发明实施例还提供了一种数据检测的装置,该装置包括:
记录生成模块,用于生成至少一个处理环节的数据记录,所述数据记录包括每个处理环节的起始数据量和生成数据量;
丢失信息确定模块,用于根据所述至少一个处理环节对应的起始数据量和生成数据量确定数据丢失信息。
进一步地,所述处理环节包括数据生成子环节和数据处理子环节,所述记录生成模块,具体用于:
在第一处理环节的数据生成子环节的起始时刻,将所述数据生成子环节的起始时刻和接收到的起始数据量记录到统计日志,所述第一处理环节为任意一个处理环节;
在所述数据生成子环节的结束时刻,将所述数据生成子环节的结束时刻和第一生成数据量记录到所述统计日志;
在所述数据处理子环节的结束时刻,将所述数据处理子环节的结束时刻和第二生成数据量记录到所述统计日志;
相应的,所述丢失信息确定模块,具体用于:
通过统计日志中接收数据总量、第一生成数据量和第二生成数据量,确定所述第一处理环节中的数据丢失信息。
进一步地,所述丢失信息确定模块,包括:
获取具有相同数据生成子环节的起始时刻的目标处理环节;
根据目标处理环节对应的起始数据量和生成数据量确定数据丢失信息;
相同数据生成时间的数据的丢失所在的环节。
进一步地,所述数据处理子环节对应的数据处理操作包括数据清洗、数据去重、数据归一化或标记数据标签中的是至少一种。
进一步地,所述处理环节包括格式转换环节、数据存入数据库环节或业务系统展示环节中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611129422.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置