[发明专利]文件处理方法、装置、系统及存储介质在审
申请号: | 202310116652.0 | 申请日: | 2023-01-30 |
公开(公告)号: | CN116050349A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 朱劲松;万振华;王颉 | 申请(专利权)人: | 深圳开源互联网安全技术有限公司 |
主分类号: | G06F40/103 | 分类号: | G06F40/103;G06F40/169 |
代理公司: | 深圳市恒程创新知识产权代理有限公司 44542 | 代理人: | 龚秀亮 |
地址: | 518000 广东省深圳市龙华区民治*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 处理 方法 装置 系统 存储 介质 | ||
本申请公开一种文件处理方法、装置、系统及存储介质,该方法包括:获取目标文件,判断所述目标文件是否是BIN文件格式;若所述目标文件是BIN文件格式,则确定所述BIN文件的shell脚本和二进制数据的分界点位置;根据所述分界点位置分离出shell脚本文件和二进制数据文件。本发明可以将LINUX安装格式BIN文件分割成一个文本文件和一个二进制文件,使BIN文件更易于检测。后续即可对分离出来的shell脚本文件、二进制数据文件单独进行扫描,以此能使检测的准确性、成功率都得到提高。
技术领域
本申请涉及文件处理技术领域,尤其涉及一种文件处理方法、装置、系统及存储介质。
背景技术
目前,网络安全行业对二进制可执行程序格式文件的漏洞、病毒的扫描和分析涉及多种格式,但仍有很多程序类文件格式未曾涉及。比如,对于LINUX安装格式BIN文件,则缺少检测的能力。
发明内容
本申请的主要目的在于提供一种文件处理方法、装置、系统及存储介质,可以拆分LINUX安装格式BIN文件,使BIN文件更易于检测,提高检测准确性和成功率。
为实现上述目的,本申请提供一种文件处理方法,其特征在于,所述方法包括以下步骤:
获取目标文件,判断所述目标文件是否是BIN文件格式;
若所述目标文件是BIN文件格式,则确定所述BIN文件的shell脚本和二进制数据的分界点位置;
根据所述分界点位置分离出shell脚本文件和二进制数据文件。
其中,所述判断所述目标文件是否是BIN文件格式的步骤包括:
判断所述目标文件的后缀是否为“.bin”,以及判断所述目标文件的文件头部是否为预设字符形式;
若所述目标文件的后缀为“.bin”,且所述目标文件的文件头部为预设字符形式,则确定所述目标文件为BIN文件格式。
其中,所述预设字符形式包括:#!两个字符或者是多个空白字符+#!的形式。
其中,所述确定所述BIN文件的shell脚本和二进制数据的分界点位置的步骤包括:
从所述BIN文件的起始位置逐字节遍历,找到第一个字节值0;
从所述字节值0的位置往前回溯,找到有正则表达式为^exit(|\t|\n)的行;
从找到的行的下一行开始往后遍历;
若找到第一个非空白字符不是'#'的行,则遍历结束,确定所述非空白字符字符为二进制数据的开头,将所述非空白字符的位置作为shell脚本和二进制数据的分界点位置。
其中,所述从找到的行的下一行开始往后遍历的步骤之后还包括:
若找到空行或空白字符组成的行,则确定该行的内容为shell脚本的范围;
若发现一行的内容中,第一个非空白字符是'#',则确定该行是shell脚本的注释内容,将该行算作shell脚本的范围。
其中,所述根据所述分界点位置分离出shell脚本文件和二进制数据文件的步骤包括:
读取从所述BIN文件的起始位置到分界点位置之前的内容并写入到一个以“.sh”为后缀的第一新文件中,将所述第一新文件作为提取得到的shell脚本文件;
读取从所述BIN文件的分界点位置开始到文件末尾的内容并写入到第二新文件中,将所述第二新文件作为提取得到的二进制数据文件。
其中,所述方法还包括:
对分离出的shell脚本文件和二进制数据文件进行检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳开源互联网安全技术有限公司,未经深圳开源互联网安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310116652.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车窗模块及车辆
- 下一篇:一种新型智能在线监测保护装置