[发明专利]数据比对方法和装置无效
申请号: | 201010507030.3 | 申请日: | 2010-09-27 |
公开(公告)号: | CN101957858A | 公开(公告)日: | 2011-01-26 |
发明(设计)人: | 高水波;华国栋;黎楚兵;史美康 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚;吴孟秋 |
地址: | 518057 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 装置 | ||
技术领域
本发明涉及通信领域,具体而言,涉及一种数据比对方法和装置。
背景技术
随着当前通讯业的不断发展,相关软件系统也越来越复杂,这些系统一般都包含许多的子系统和外围系统,为了保证这些系统数据的一致性,经常需要去比较各系统间的同类数据,使其保持一致,以保证整个系统的正常运行。
由于在通讯行业内,比较的这类数据量通常十分庞大,采用一般的文本比较工具来处理很容易出错,目前业内也有各式各样的比对方法:
1)采用第三方工具,诸如ue、merge等工具软件结合使用来比对;
2)在数据库中通过存储过程采用游标的方式来比对;
3)采用hash(Hash,一种常用的数据存储结构,又叫哈希表或散列表)表存储数据的方式来比对。
上述方法1)用来比较小数据量的文件数据时还可以胜任,但如果用来处理大量数据的时候,往往操作者会顾此失彼,产生很多错误,这样也致使比对的效率十分低下;方法2)所采用的方式是借助数据库的特性来处理完成比对工作,这不失为一个简便的处理方式,但是其缺点正是数据库本身带来的:对系统软、硬件环境的依赖性高,处理速度也很慢;方法3)是当前被普遍采用的一种比对方法,相对于前面的两种方式,其拥有处理效率较高的优势,但是发明人经过测试发现其在处理海量数据的时候,对计算机的软、硬件的要求很高,对内存的占用率特别大。
通过上述分析,根据现有技术中的数据比对方法,内存占用率较高,执行时间较长、效率较低。
发明内容
针对现有技术中的数据比对方法导致内存占用率较高的问题而提出本发明,为此,本发明的主要目的在于提供一种数据比对方法和装置,以解决上述问题至少之一。
为了实现上述目的,根据本发明的一个方面,提供了一种数据比对方法,其包括:将源文件的第一哈希HASH信息与目标文件的第二HASH信息进行比较;根据比较结果生成上述源文件与上述目标文件的比对结果。
进一步地,将源文件的第一哈希HASH信息与目标文件的第二HASH信息进行比较包括:在内存中建立与上述源文件对应的内存索引表,其中,上述内存索引表包括与上述第一哈希HASH信息中的所有HASH值对应的索引记录;在上述内存索引表中查找是否存在与上述第二HASH信息对应的索引记录,其中,上述索引记录中的HASH值等于上述第二HASH信息中的HASH值。
进一步地,在内存中建立与上述源文件对应的内存索引表时,还包括:在上述内存中建立冲突列表,其中,上述冲突列表为连续存储空间,用于保存在比对上述源文件与上述目标文件时产生的冲突元素。
进一步地,根据比较结果生成上述源文件与上述目标文件的比对结果包括:若在上述内存索引表中查找出存在与上述第二HASH信息对应的索引记录,则生成第一指示信息,其中,上述第一指示信息用于指示上述源文件与上述目标文件共同具有与查找出的上述索引记录中的HASH值对应的数据信息;若在上述内存索引表中查找出不存在与上述第二HASH信息对应的索引记录,则生成第二指示信息,其中,上述第二指示信息用于指示上述源文件中不具有与上述第二HASH信息中的HASH值对应的数据信息。
进一步地,根据比较结果生成上述源文件与上述目标文件的比对结果包括:若在上述内存索引表中查找出存在与上述第二HASH信息对应的索引记录,则将上述目标文件中与第二HASH信息对应的记录信息与上述源文件中与上述索引记录对应的记录信息进行比较;若两者相同,则生成第三指示信息,其中,上述第三指示信息用于指示上述源文件与上述目标文件共同具有与查找出的上述索引记录中的HASH值对应的数据信息;若在上述内存索引表中查找出不存在与上述第二HASH信息对应的索引记录,则生成第四指示信息,其中,上述第四指示信息用于指示上述源文件中不具有与上述第二HASH信息中的HASH值对应的数据信息。
进一步地,上述源文件与上述目标文件具有相同的文件格式。
为了实现上述目的,根据本发明的另一方面,提供了一种数据比对装置,其包括:比较单元,用于将源文件的第一哈希HASH信息与目标文件的第二HASH信息进行比较;生成单元,用于根据比较结果生成上述源文件与上述目标文件的比对结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010507030.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置