[发明专利]一种文件处理方法及装置在审
申请号: | 201711306239.1 | 申请日: | 2017-12-11 |
公开(公告)号: | CN108038188A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 王同庆 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 处理 方法 装置 | ||
本发明提供的文件处理方法及装置,在对文件进行存储处理时,对文件进行内容分块并为分块所得的各文件块建立索引信息,在此基础上,对文件目录、文件分块信息及文件块索引信息进行对应存储,同时对文件进行压缩存储并删除原始文件;后续具体通过对文件对应的各文件块索引信息进行查询,来实现所需的文件查询。由于本发明方案对文件目录、文件分块信息及文件块索引信息进行对应存储,同时对文件进行压缩存储并删除原始文件,从而与存储原始文件的传统存储方式相比,可有效节约存储空间,同时,由于本发明对文件的各文件块索引信息而非原始文件进行查询,从而可提升文件查询效率,鉴于此,本发明可实现低成本、高效率地存储和查询各种数据文件。
技术领域
本发明属于数据文件的存储、查询技术领域,尤其涉及一种文件处理方法及装置。
背景技术
在当前的互联网及信息化时代,产生了大量的文字信息,进而产生了大量的数据文件,其中word\excel\txt\html\java\xml\css是最基本和常用的形式。
对于这些大量的数据文件而言,必然面临着数据文件的存储和查询问题,目前市面上一般通过谷歌、百度等公司提供的商业化文件存储和查询服务,来进行数据文档的存储和查询,但是对于中小企业而言,目前的这些商业化存储和查询服务普遍存在费用较高,文件占用空间大,查询搜索速度慢等缺点。
因此,本领域亟需提供一种较优的数据文件处理方法,以满足中小企业在文件存储及查询方面的需求,实现低成本、高效率地存储和查询各种数据文件。
发明内容
有鉴于此,本发明的目的在于提供一种文件处理方法及装置,旨在实现能够低成本、高效率地存储和查询各种数据文件。
为此,本发明公开如下技术方案:
一种文件处理方法,用于实现文件存储,所述方法包括:
获得待处理文件;
对所述待处理文件进行内容分块处理,得到各个文件块及文件分块信息;
为每个文件块建立索引信息,得到每个文件块的文件块索引信息;
将预定的文件目录、所述文件分块信息以及各个文件块的文件块索引信息进行对应存储;
对所述待处理文件进行压缩处理,将压缩处理后所得的压缩文件存储于所述预定的文件目录下,并删除所述待处理文件。
上述方法,优选的,所述获得待处理文件,包括:
获得用户向文件服务器上传的待处理文件。
上述方法,优选的,所述对所述待处理文件进行内容分块处理,包括:
基于预定的数据量阈值,将所述待处理文件分为相应数量的文件块;其中,每个文件块的数据量不高于所述数据量阈值;
上述方法,优选的,所述为每个文件块建立索引信息,得到每个文件块的文件块索引信息,包括:
对每个文件块进行切词处理,得到所述每个文件块对应的关键字列表;
根据所述每个文件块对应的关键字列表,为所述每个文件块建立关键字索引。
一种文件处理方法,用于实现文件查询,所述用于实现文件查询的文件处理方法包括:
获得用户输入的文件查询信息;
利用所述文件查询信息,在各个文件所对应文件块的文件块索引信息中进行查询,得到文件块索引信息查询结果;
根据所述文件块索引信息查询结果,生成与所述文件查询信息相匹配的文件查询结果。
上述方法,优选的,所述获得用户输入的文件查询信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711306239.1/2.html,转载请声明来源钻瓜专利网。