[实用新型]数据清洗系统有效
申请号: | 201621053628.9 | 申请日: | 2016-09-13 |
公开(公告)号: | CN206209711U | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 贾西贝 | 申请(专利权)人: | 深圳市华傲数据技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京酷爱智慧知识产权代理有限公司11514 | 代理人: | 李娜 |
地址: | 518000 广东省深圳市龙华新区清*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 清洗 系统 | ||
技术领域
本实用新型涉及计算机技术,尤其涉及一种数据清洗系统。
背景技术
数据清洗是指发现并纠正数据文件中的可识别的错误,主要包括检查数据一致性,处理数据中的无效值和缺失值等,银行地址数据清洗属于数据清洗中的一种。目前,银行进行信用卡推广的过程中,会接收到大量的用户地址信息,并且,为了便于后续与用户进行联系,还需要保证这些地址信息的真实有效。但实际上,用户提供的地址可能是错误的或者不全的,这就需要通过数据清洗的方式得到标准地址,即对地址数据进行清洗。
为了实现对庞大的数据进行有效清洗,例如对地址数据进行清洗,需要与之配套的硬件环境提供硬件支持,以满足对数据清洗的需要。
实用新型内容
本实用新型要解决的技术问题是提供一种数据清洗系统,为满足对数据清洗提供硬件支持。
为解决上述技术问题,本实用新型提供一种数据清洗系统,包括,数据服务器集群,数据清洗设备,清洗规则库服务器,交换机,硬件防火墙和众包服务器;数据服务器集群连接于数据清洗设备,且数据清洗设备连接于清洗规则库服务器;交换机分别连接数据服务器集群,清洗规则库服务器和硬件防火墙;硬件防火墙连接众包服务器,且交换机通过硬件防火墙与众包服务器连接。
进一步地,硬件防火墙与众包服务器连接的载体是互联网。
进一步地,数据库服务器集群与数据清洗设备连接的载体为线缆或互联网。
进一步地,交换机为光纤交换机。
本实用新型提供的数据清洗系统,数据清洗设备能够将数据服务器集群中的数据(例如,地址数据)引流至数据清洗设备,并根据清洗规则库服务器中保存的清洗规则进行数据清洗,并将清洗好的数据回流至数据服务器集群中,如此完成对数据的清洗。此外,对于数据清洗设备无法清洗的数据,则通过交换机和硬件防火墙将其发送至众包服务器中,由众包服务器将这些无法清洗的数据以众包的形式进行分发再将清洗好的数据收回以完成对数据的清洗。本实用新型的数据清洗系统,可以同时支持采用数据清洗设备进行数据清洗和采用众包服务器以众包的形式进行数据清洗,两种数据清洗方式相结合,可以提高数据清洗的质量。
也就是说,本实用新型提供的数据清洗系统,能够满足对数据清洗提供硬件支持。
附图说明
图1是本实用新型提供的数据清洗系统的结构框图。
具体实施方式
下面通过具体的实施例进一步说明本实用新型,但是,应当理解为,这些实施例仅仅是用于更详细具体地说明之用,而不应理解为用于以任何形式限制本实用新型。
结合图1,本实施例提供的数据清洗系统,包括,数据服务器集群1,数据清洗设备2,清洗规则库服务器3,交换机4,硬件防火墙5和众包服务器6;数据服务器集群1连接于数据清洗设备2,且数据清洗设备2连接于清洗规则库服务器3;交换机4分别连接数据服务器集群1,清洗规则库服务器3和硬件防火墙5;硬件防火墙5连接众包服务器6,且交换机4通过硬件防火墙5与众包服务器6连接。
本实施例提供的数据清洗系统,数据清洗设备2能够将数据服务器集群1中的数据(例如,地址数据)引流至数据清洗设备2,并根据清洗规则库服务器3中保存的清洗规则进行数据清洗,并将清洗好的数据回流至数据服务器集群1中,如此完成对数据的清洗。此外,对于数据清洗设备2无法清洗的数据,则通过交换机4和硬件防火墙5将其发送至众包服务器6中,由众包服务器6将这些无法清洗的数据以众包的形式进行分发再将清洗好的数据收回以完成对数据的清洗。本实施例的数据清洗系统,可以同时支持采用数据清洗设备2进行数据清洗和采用众包服务器6以众包的形式进行数据清洗,两种数据清洗方式相结合,可以提高数据清洗的质量。
也就是说,本实施例提供的数据清洗系统,能够满足对数据清洗提供硬件支持。
此外,本实施例中,还能够将通过众包服务器6返回给交换机4中的清洗好的数据,作为数据清洗规则存储在清洗规则库服务器3中,可以实现数据清洗设备2的自学习,从而,可以不断提高数据清洗设备2对数据的清洗能力。
优选地,硬件防火墙5与众包服务器6连接的载体是互联网。
进一步优选地,数据库服务器集群与数据清洗设备2连接的载体为线缆或互联网。
进一步优选地,交换机4为光纤交换机。
尽管本实用新型已进行了一定程度的描述,明显地,在不脱离本实用新型的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本实用新型不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华傲数据技术有限公司,未经深圳市华傲数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201621053628.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置