[发明专利]一种数据库近似字典规则的挖掘方法、系统及数据库终端有效

专利信息
申请号: 201210471801.7 申请日: 2012-11-20
公开(公告)号: CN103353864A 公开(公告)日: 2013-10-16
发明(设计)人: 王明兴;贾西贝 申请(专利权)人: 深圳市华傲数据技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 518057 广东省深圳市高*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据库 近似 字典 规则 挖掘 方法 系统 终端
【说明书】:

技术领域

发明涉及近似字典规则挖掘领域,尤其涉及一种数据库近似字典规则的挖掘方法、系统及数据库终端。

背景技术

随着互联网的快速发展和社会各领域信息化水平的提高,数据量正以史无前例的速度井喷,人类正在进入大数据时代。大数据时代的特征是数据量更大,数据来源更复杂,数据更新速度更快,数据质量良莠不齐,仅靠人工手段几乎无法进行数据质量管理。数据管理领域正孕育着大变革、大突破,已经商用的技术基本停留在手工的、基于经验的第二代数据质量管理阶段,自动化的、基于严谨理论体系的第三代数据质量管理商用系统还没有出现。自动化的管理体系中一个重要的内容就是自动化的数据质量挖掘规则,其中一类规则就是字典规则,特别是近似字典规则。

如考虑如下表所示的部分邮政编码数据,根据规则{区县编码,014060}=>{邮政编码,014060},表明当区县编码为014060时,90%情况下邮政编码为014060,另外10%数据(010460)则是可疑的,很可能是数据错误。

  邮政编码  省份编码  地区编码  区县编码  地址  014060  15  0140  014060  万泉街  014060  15  0140  014060  三道沙河村  014060  15  0140  014060  二道沙河西村  014060  15  0140  014060  健康路  014060  15  0140  014060  健新街  014060  15  0140  014060  兴胜镇  014060  15  0140  014060  转龙街  014060  15  0140  014060  果园北街  014060  15  0140  014060  果园南街  010460  15  0140  014060  新城镇

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华傲数据技术有限公司,未经深圳市华傲数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210471801.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top