[发明专利]一种数据仓库数据异常的预检测方法和设备有效
申请号: | 201510742748.3 | 申请日: | 2015-11-04 |
公开(公告)号: | CN106649414B | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 方鹏飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/21 |
代理公司: | 11297 北京睿博行远知识产权代理有限公司 | 代理人: | 龚家骅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据仓库 数据 异常 预检 方法 设备 | ||
本申请公开了一种数据仓库数据异常的预检测方法和设备,通过应用本申请实施例所提出的技术方案,服务器将当前的在线数据同步到数据仓库中作为待检测的基础数据,与之前的离线数据进行对比,并在基础数据出现变化的情况下,按照之前的处理规则生成模拟应用数据,进一步通过与之前的应用数据进行对比,来确定数据是否异常,从而,服务器可以对数据异常进行预判,而待检测的基础数据和模拟应用数据均为预生成的数据,可以有效的避免由于发现数据异常的滞后性而引起的不可挽回的损失,同时还节省了对异常数据进行修复时而产生的不必要的成本。
技术领域
本申请涉及数据仓库领域,特别是涉及一种数据仓库数据异常的预检测方法和设备。
背景技术
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策,所述数据仓库中的数据从产生到使用需要间隔T(Today,今天)+1一天,即今天产生的数据明天才可以使用,具体的,当所述数据仓库中存储的数据位打分规则时,服务器获取今天需要打分的对象,所述服务器在明天的时候才能使用所述数据仓库中的打分规则对获取的对象进行打分。
传统数据仓库常采用T+1同步在线数据并在此基础上计算T+1的应用结果。当在线数据是一些人工配置的打分规则信息时,而基于此信息,需要进行离线计算时,如果人工配置出错,打分结果则会出现异常,且不易被发现及处理。
在现有技术中,是在根据T+1打分规则产生打分结果后,再对打分规则进行效验,即今天产生的打分规则后,在明天根据今天的打分规则产生打分结果后再对今天的打分规则进行效验。
在实现本申请的过程中,申请人发现现有技术至少存在以下问题:
T+1的运行流程计算完毕之后,只能通过实际计算结果监控亦或是应用到实际业务中才能发现问题,发现数据异常具有严重的滞后性,数据质量问题已成事实,数据修复有一定成本,但是对对业务造成的损失有可能是无法挽回的。
发明内容
本申请的目的在于提供一种数据仓库数据异常的预检测方法和设备,在当前规则配置下的在线数据和离线基础数据的对比,对数据异常进行预判,进而避免由于发现数据异常的滞后性而引起的不可挽回的损失,同时还节省了对异常数据进行修复时而产生的不必要的成本。
一方面,本申请实施例提出了一种数据仓库数据异常的预检测方法,所述方法包括:
服务器根据预设的同步周期,将当前的在线数据同步到数据仓库中,作为待检测的基础数据;
所述服务器判断所述待检测的基础数据与上一个同步周期的基础数据是否相同;
如果判断结果为否,所述服务器根据前一个打分周期的处理规则,对所述待检测的基础数据生成模拟应用数据;
所述服务器判断所述模拟应用数据与所述前一个打分周期的应用数据是否相同;
如果判断结果为否,所述服务器确定数据仓库数据异常。
优选的,在当前的同步周期为当前的打分周期内的第一个同步周期时,所述服务器判断所述待检测的基础数据与上一个同步周期的基础数据是否相同,具体为:
所述服务器使用当前打分周期的第一个同步周期的待检测的基础数据与上一个打分周期的最后一个同步周期的基础数据进行对比,判断两者是否相同。
优选的,所述服务器判断所述待检测的基础数据与上一个同步周期的基础数据是否相同之后,还包括:
如果判断结果为是,所述服务器确定数据仓库数据正常。
优选的,所述服务器判断所述模拟应用数据与所述前一个打分周期的应用数据是否相同之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510742748.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页标签的分组方法和装置
- 下一篇:客户端数据检查更新方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置