[发明专利]用于文件比较的散列数据结构以及散列比较系统和方法无效

申请号：	201210333023.5	申请日：	2012-09-10
公开（公告）号：	CN102945241A	公开（公告）日：	2013-02-27
发明（设计）人：	张星国;刘光喜;成周弦;陈譓瑱;李允珩	申请（专利权）人：	新游游戏株式会社
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	吕俊刚;刘久亮
地址：	韩国***	国省代码：	韩国;KR
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于文件比较数据结构以及系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明一般地涉及用于数据文件的散列技术，更具体地，涉及散列数据结构以及利用该散列数据结构的散列比较系统和方法，其将散列值与源文件的唯一特性信息一起使用，因此更快速地进行文件比较。

背景技术

已经在多种操作中使用在多个数据（特别是数据文件）之间的比较。例如，实质上已经在多种操作中使用如此的文件比较，从而检查在操作系统（OS）中的文件之间的变化或者将补丁文件与源文件进行比较从而执行预定的补丁。

已经使用的传统文件比较技术包括比较所有文件的方法、将版本信息分配给文件并且基于版本信息检查文件的方法、将散列函数应用到文件并且然后比较文件的方法等。

因为存在大量的数据要比较并且比较的速度缓慢，所以比较所有文件的方法不被频繁地使用。将版本信息分配给文件并且比较文件的方法的缺陷在于，即使文件的内容被改变，文件内容也可能不与版本信息匹配，除非文件版本信息被改变，从而由于如此的失配而没有正确地进行文件比较。

因此，在大多数情形中，通过将散列函数应用到文件而计算散列值，并且通过比较计算的散列值而比较文件的内容。然而，仅使用散列值的该传统比较方法的问题在于，当文件的大小较大时，需要更多的计算资源来生成散列值，并且执行相应的操作所需的时间增加。

发明内容

因此，本发明的宗旨是解决现有技术中出现的以上问题，并且本发明的目的是提供能够利用更小量的资源容易地将文件相互比较的散列数据结构。

本发明的另一个目的是提供关于所述结构的散列数据结构生成方法和散列数据结构比较方法，其可以利用文件比较所需的散列数据结构来更加快速地将文件相互比较。

本发明的又一个目的是提供散列比较系统，其可以利用文件比较所需的散列数据结构来有效地将文件相互比较。

根据实现上述目的的本发明的方面，提出了一种散列数据结构，该结构包括：由预定的数据比特构成的并且与源文件的属性有关的文件信息、和由特定数据比特构成的并且与源文件有关的散列值，其中，所述散列数据结构包括在与文件信息相对应的数据比特之后的与散列值相对应的数据比特。

在实施方式中，文件信息可以包括所述源文件的大小值、包括所述源文件的开始的数据的第一部分数据和包括所述源文件的最后的数据的第二部分数据中的至少一个。

在实施方式中，所述散列数据结构可以进一步包括结构头部，该结构头部包括与在该散列数据结构中包括的散列值和文件信息中的每一个相关的结构信息。

在实施方式中，所述散列数据结构可以进一步包括与该散列数据结构相关的奇偶校验信息，其中，所述奇偶校验信息包括用于文件信息的第一奇偶校验比特和用于散列值的第二奇偶校验比特。

根据实现上述目的的本发明的另一个方面，提出了一种用于生成将用来比较源文件的各个散列数据的散列数据生成方法，该方法包括以下步骤：（a）检查每一个源文件的属性并且基于经检查的属性而生成由预定数据比特构成的文件信息；（b）通过将散列算法应用到所述源文件的至少一部分而计算散列值；以及（c）通过连续地将所述散列值连接到所述文件信息而生成散列数据。

在实施方式中，步骤（a）可以包括：检查所述源文件的大小、名称以及格式、包括所述源文件的开始的数据的第一部分数据和包括所述源文件的最后的数据的第二部分数据中的至少一个；以及，生成包括所述源文件的大小、名称以及格式、包括所述源文件的开始的数据的第一部分数据和包括所述源文件的最后的数据的第二部分数据中的至少一个的所述文件信息。

在实施方式中，该散列数据生成方法可以进一步包括步骤（d）：生成用于所述散列数据的散列奇偶校验比特。

在实施方式中，步骤（d）可以包括：生成用于所述文件信息的第一奇偶校验比特；生成用于所述散列值的第二奇偶校验比特；以及通过连续地连接所述第一奇偶校验比特和所述第二奇偶校验比特而生成所述散列奇偶校验比特。

根据实现上述目的的本发明的又一个方面，提出了一种用于生成将用来比较源文件的各个散列数据的散列数据生成方法，该方法包括以下步骤：（a）生成包括与在散列数据结构中包括的散列值和文件信息中的每一个相关的结构信息的结构头部；（b）检查每一个源文件的属性并且基于经检查的属性而生成由预定数据比特构成的文件信息；（c）通过将散列算法应用到所述源文件的至少一部分而生成散列值；以及（d）通过连续地将所述散列值连接到所述文件信息而生成散列数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于新游游戏株式会社，未经新游游戏株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210333023.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于文件比较的散列数据结构以及散列比较系统和方法无效

专利文献下载