[发明专利]一种对批量数据进行自动修复的方法及系统在审
申请号: | 201310637254.X | 申请日: | 2013-12-04 |
公开(公告)号: | CN103714415A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 王诗菡;贾西贝 | 申请(专利权)人: | 深圳市华傲数据技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市南山区高新区中*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 批量 数据 进行 自动 修复 方法 系统 | ||
技术领域
本发明涉及数据修复领域,尤其涉及一种对批量数据进行自动修复的方法及系统。
背景技术
大型的集团控股公司,拥有总公司和分散到各地的若干子公司或分公司。这些集团股份总公司的主数据系统都有统一、严格的数据管理机制;同时为了提高基础数据质量,降低业务数据分析处理难度,提高业务数据准确性,总公司会对主数据进行认真的清洗和维护,然而若干子公司或分公司则并没有如此完善的数据管理体系,每个子公司或分公司在录入待处理的业务数据时,常常都有自己的输入方式,使得不同子公司或分公司的数据形式无法保持一致。甚至于,因为不同的子公司或分公司最终都会把自己的业务数据汇总到主数据中,在数据的录入过程中,会引入错误到主数据库当中。特别是对批量数据进行处理的情况下,就会因为数据标准不一致或者人为因素会导致数据的错误,影响了公司整体数据的质量,因此需要一种对批量数据录入时就进行监控与修复的数据修复方法。
发明内容
为此,本发明为了解决上述缺陷之一。
因而本发明提供一种对批量数据进行自动修复的方法及系统,通过采用规则对批量数据进行过滤并与用户交互确定正确数据从而对其他不确定数据进行规则审核与修复,从而对批量数据进行了自动修复,确保了数据正确和数据质量。
所以,本发明一个实施例提供一种对批量数据进行自动修复的方法,该方法包括:检测当前批量待录入数据,并触发自动修复步骤;采用规则过滤并逐条遍历可能不正确的待录入数据步骤;通过与用户交互来确定正确的数据步骤;根据上述正确的数据和规则来审核其他不确定的数据,并对错误的数据进行标记步骤;子系统根据参考数据对上述错误的数据进行更新,并将更新后的数据录入到子系统的数据库步骤。
优选地,所述采用规则过滤得到正确的数据。
优选地,所述采用规则过滤得到正确的数据由规则间不冲突来确定。
优选地,所述可能不正确的待录入数据为根据规则过滤得到规则间相冲突的数据。
优选地,所述用户交互来确定正确的数据从可能不正确的待录入数据中指定。
进一步地,所述根据上述正确的数据和规则来审核其他不确定的数据具体包括以下步骤:防火墙系统获取已知规则列表和已确定的数据属性集合步骤;根据所述规则的逻辑顺序确定它们的依赖关系步骤;从上述规则中确定能直接应用的规则集合VSet步骤;遍历规则集合VSet,如果规则集合VSet为空,则输出确认的属性集合,否则,审核和修复规则集合VSet中规则对应的确定属性,并通过依赖关系找到所述规定推出的其他规则,将这些规则对应的确定属性放入到规则集合VSet中步骤。
优选地,所述依据所述规则的逻辑顺序确定它们的依赖关系依据所述规则的属性值进行。
优选地,所述对错误的数据进行更新包括根据参考数据中数据所属的正确值更新所述错误数据的对应属性。本发明通过采用规则对批量数据进行过滤并与用户交互确定正确数据从而对其他不确定数据进行规则审核与修复,从而对批量数据进行了自动修复,确保了数据正确和数据质量。
本发明另一个实施例提供一种对批量数据进行自动修复的系统,该系统包括:数据检测单元,用于检测当前批量待录入数据,并触发自动修复;数据过滤单元,用于采用规则过滤并逐条遍历可能不正确的待录入数据;数据交互单元,用于通过与用户交互来确定正确的数据;数据审核单元,用于根据上述正确的数据和规则来审核其他不确定的数据,并对错误的数据进行标记;数据更新单元,用于子系统根据参考数据对上述错误的数据进行更新,并将更新后的数据录入到子系统的数据库。
优选地,所述数据过滤单元采用规则过滤得到正确的数据。
进一步地,所述数据审核单元所述根据上述正确的数据和规则来审核其他不确定的数据具体包括以下步骤:防火墙系统获取已知规则列表和已确定的数据属性集合步骤;根据所述规则的逻辑顺序确定它们的依赖关系步骤;从上述规则中确定能直接应用的规则集合VSet步骤;遍历规则集合VSet,如果规则集合VSet为空,则输出确认的属性集合,否则,审核和修复规则集合VSet中规则对应的确定属性,并通过依赖关系找到所述规定推出的其他规则,将这些规则对应的确定属性放入到规则集合VSet中步骤。
优选地,所述依据所述规则的逻辑顺序确定它们的依赖关系依据所述规则的属性值进行。本发明通过采用规则对批量数据进行过滤并与用户交互确定正确数据从而对其他不确定数据进行规则审核与修复,从而对批量数据进行了自动修复,确保了数据正确和数据质量。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华傲数据技术有限公司,未经深圳市华傲数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310637254.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有储物筐的凉爽结实的椅子
- 下一篇:一种便携式转椅
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置