[发明专利]文件识别方法、装置、存储介质及处理器在审
申请号: | 202110874331.8 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113590557A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 李远明;喻波;王志海;韩振国 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | G06F16/17 | 分类号: | G06F16/17 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周春枚 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 识别 方法 装置 存储 介质 处理器 | ||
本发明公开了一种文件识别方法、装置、存储介质及处理器。其中,该方法包括:获取待识别压缩文件;识别待识别压缩文件的文件类型,其中,文件类型包括:分卷压缩文件和完整压缩文件;基于待识别压缩文件的文件类型对待识别压缩文件进行解压,得到待识别非压缩文件;识别所述待识别非压缩文件的内容。本发明解决了无法对分卷压缩文件进行识别的技术问题。
技术领域
本发明涉及计算机领域,具体而言,涉及一种文件识别方法、装置、存储介质及处理器。
背景技术
传输大的压缩文件时,比如发送邮件,单个邮件的附件太大,导致传输时间过长,出现最后传输失败,全部的传输都失败的问题。并且,超大压缩文件的传输和转移事件极其消耗时间和系统资源,在高并发环境中对系统的整体吞吐量影响较大,为实现将大文件分批传输或类似断点续传或者保密传输的目标,采取将文件压缩成分卷压缩文件,分次发送,从而提高系统性能。
但是,对于分卷压缩文件,现有方式无法进行有效的识别和扫描。
针对上述无法对分卷压缩文件进行识别的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种文件识别方法、装置、存储介质及处理器,以至少解决无法对分卷压缩文件进行识别的技术问题。
根据本发明实施例的一个方面,提供了一种文件识别方法,包括:获取待识别压缩文件;识别所述待识别压缩文件的文件类型,其中,所述文件类型包括:分卷压缩文件和完整压缩文件;在所述待识别压缩文件属于所述分卷压缩文件的情况下,获取同一所述分卷压缩文件对应的多个所述待识别压缩文件;对同一所述分卷压缩文件下的多个所述待识别压缩文件进行解压,得到待识别非压缩文件;识别所述待识别非压缩文件的内容。
可选地,在获取待传输压缩文件之前,所述方法还包括:获取待识别文件,其中,所述待识别文件包括:待识别压缩文件和待识别非压缩文件;判断所述待识别文件是否属于待识别压缩文件;在所述待识别文件不属于所述待识别压缩文件的情况下,确定所述待识别文件属于所述待识别非压缩文件;识别所述待识别非压缩文件的内容。
可选地,在识别所述待识别压缩文件的文件类型之后,所述方法还包括:在所述待识别压缩文件属于所述完整压缩文件的情况下,对所述待识别压缩文件进行解压,得到所述待识别非压缩文件。
可选地,在所述待识别压缩文件属于所述分卷压缩文件的情况下,获取同一所述分卷压缩文件对应的多个所述待识别压缩文件包括:在当前所述待识别压缩文件属于所述分卷压缩文件的情况下,存储当前所述待识别压缩文件,并获取下一个所述待识别压缩文件,直到同一所述分卷压缩文件对应的多个所述待识别压缩文件均被获取。
可选地,识别所述待识别压缩文件的文件类型包括:获取所述待识别压缩文件的身份标识;基于所述身份标识识别所述待识别压缩文件的文件类型。
可选地,识别所述待识别非压缩文件的内容包括:判断所述待识别非压缩文件的内容是否命中预定策略;在所述待识别非压缩文件的内容命中所述预定策略的情况下,确定所述待识别非压缩文件属于异常文件,并将所述异常文件作为证据文件上报。
根据本发明实施例的另一方面,还提供了一种文件识别装置,包括:第一获取单元,用于获取待识别压缩文件;第一识别单元,用于识别所述待识别压缩文件的文件类型,其中,所述文件类型包括:分卷压缩文件和完整压缩文件;第二获取单元,用于在所述待识别压缩文件属于所述分卷压缩文件的情况下,获取同一所述分卷压缩文件对应的多个所述待识别压缩文件;第一解压单元,用于对同一所述分卷压缩文件下的多个所述待识别压缩文件进行解压,得到待识别非压缩文件;第二识别单元,用于识别所述待识别非压缩文件的内容。
可选地,所述第二获取单元包括:存储模块,用于在当前所述待识别压缩文件属于所述分卷压缩文件的情况下,存储当前所述待识别压缩文件,并获取下一个所述待识别压缩文件,直到同一所述分卷压缩文件对应的多个所述待识别压缩文件均被获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110874331.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动钉枪用码钉推钉装置
- 下一篇:供料器状态检测方法及装置