[发明专利]一种数据库近似字典规则的挖掘方法、系统及数据库终端有效
申请号: | 201210471801.7 | 申请日: | 2012-11-20 |
公开(公告)号: | CN103353864A | 公开(公告)日: | 2013-10-16 |
发明(设计)人: | 王明兴;贾西贝 | 申请(专利权)人: | 深圳市华傲数据技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 近似 字典 规则 挖掘 方法 系统 终端 | ||
技术领域
本发明涉及近似字典规则挖掘领域,尤其涉及一种数据库近似字典规则的挖掘方法、系统及数据库终端。
背景技术
随着互联网的快速发展和社会各领域信息化水平的提高,数据量正以史无前例的速度井喷,人类正在进入大数据时代。大数据时代的特征是数据量更大,数据来源更复杂,数据更新速度更快,数据质量良莠不齐,仅靠人工手段几乎无法进行数据质量管理。数据管理领域正孕育着大变革、大突破,已经商用的技术基本停留在手工的、基于经验的第二代数据质量管理阶段,自动化的、基于严谨理论体系的第三代数据质量管理商用系统还没有出现。自动化的管理体系中一个重要的内容就是自动化的数据质量挖掘规则,其中一类规则就是字典规则,特别是近似字典规则。
如考虑如下表所示的部分邮政编码数据,根据规则{区县编码,014060}=>{邮政编码,014060},表明当区县编码为014060时,90%情况下邮政编码为014060,另外10%数据(010460)则是可疑的,很可能是数据错误。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市华傲数据技术有限公司,未经深圳市华傲数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210471801.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户数据查找方法及装置
- 下一篇:一种可在线编辑的LED显示控制系统及方法