[发明专利]一种基于索引进行文件比对的方法和装置在审

专利信息
申请号: 201310042343.X 申请日: 2013-02-04
公开(公告)号: CN103970792A 公开(公告)日: 2014-08-06
发明(设计)人: 张逊;李岭;吴金坛;吕苏;马军 申请(专利权)人: 中国银联股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 郑冀之;汤春龙
地址: 200135 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 索引 进行 文件 方法 装置
【说明书】:

技术领域

发明涉及文件比对,并且尤其涉及基于索引进行文件比对的方法和装置。

背景技术

目前,在进行文件比对通常会读取整个文件,将整个文件装入内存逐个记录或逐行进行比较,需要对双边文件进行两次遍历,耗时较长,占用系统资源较大,效率较低。而且,现有技术中的文件比对方法不能对文件中的记录进行排序,在处理记录乱序文件的时候无法有效找出异同记录,对于两个记录相同,但是记录顺序不同的文件无法进行有效比较,甚至出现错误的比对结果。

发明内容

根据本发明的一个目的,公开一种基于索引进行文件比对的方法,该文件由多个记录组成,该方法包括以下步骤:

获取第一文件和第二文件中的记录的主键,

根据获取的主键,为所述第一文件和第二文件中的记录建立索引,

按照索引,匹配所述第一文件和第二文件中的记录的主键,

将主键匹配的记录进行比对,并且将比对结果写入结果文件。

优选地,将主键不匹配的索引信息写入结果文件。

优选地,根据预置的主键解析规则从第一文件和第二文件中的记录获取主键。

优选地,所述索引还包括与获取的主键对应的记录在文件中的行号。

优选地,根据匹配的主键获取记录的行号,根据行号定位文件中的该记录。

根据本发明的另一个目的,公开一种基于索引进行文件比对的装置,该文件由多个记录组成,该装置包括:

文件比对器和索引生成器,其中,

索引生成器被配置成:

获取第一文件和第二文件中的记录的主键,

根据获取的主键,为所述第一文件和第二文件中的记录建立索引,

文件比对器被配置成:

按照索引,匹配所述第一文件和第二文件中的记录的主键,

将主键匹配的记录进行比对,并且将比对结果写入结果文件。

优选地,索引生成器进一步被配置成:

将主键不匹配的索引信息写入结果文件。

优选地,索引生成器进一步被配置成:

根据预置的主键解析规则从第一文件和第二文件中的记录获取主键。

优选地,所述索引还包括与获取的主键对应的记录在文件中的行号。

优选地,文件比对器进一步被配置成:

根据匹配的主键获取记录的行号,根据行号定位文件中的该记录。

本发明通过对文件进行预处理,建立索引,然后再按照索引比对文件。本发明的一个优势在于可以在文件比对之前对文件中的记录进行排序,实现对于记录乱序的文件的比对。本发明的另一个优势在于是能够对文件进行预处理,找出单边不存在(双方不匹配)的记录不对其进行比对,节约了系统资源也节约了重复比对的时间成本。本发明的另一个优势在于按照索引进行排序避免按照行内容进行排序,节省了内存空间,缩短了排序时间,提高了比对效率。

附图说明

在参照附图阅读了本发明的具体实施方式以后,本领域技术人员将会更清楚地了解本发明的各个方面。本领域技术人员应当理解的是,这些附图仅仅用于配合具体实施方式说明本发明的技术方案,而并非意在对本发明的保护范围构成限制。其中,

图1是根据本发明实施例的基于索引进行文件比对的方法的示意图。

图2是根据本发明实施例的索引生成示例。

图3是根据本发明实施例的基于索引进行文件比对的方法的步骤示意图。

具体实施方式

下面参照附图,对本发明的具体实施方式作进一步的详细描述。在下面的描述中,为了解释的目的,陈述许多具体细节以便提供对实施例的一个或多个方面的透彻理解。然而,对于本领域技术人员可以显而易见的是,可以这些具体细节的较少程度来实践各实施例的一个或多个方面。因此下面的描述不被视为局限性的,而是通过所附权利要求来限定保护范围。

图1是根据本发明实施例的基于索引进行文件比对的方法的示意图。如图1所示,基于索引进行文件比对总体上可以分为两个步骤,即文件比对和索引生成。在索引生成的步骤中,首先分别从文件1和文件2获取主键,这里的主键对应于文件1和文件2中的记录。可以分别对文件1的主键和文件2的主键排序,然后生成索引。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310042343.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top