[发明专利]一种文件识别方法、装置、设备及存储介质在审
申请号: | 201910594025.1 | 申请日: | 2019-07-03 |
公开(公告)号: | CN112182569A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 曹有理;许天胜;谭昱;杨耀荣 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F21/57 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 识别 方法 装置 设备 存储 介质 | ||
本发明涉及一种文件识别方法、装置、设备及存储介质,包括:确定待识别文件的类型;利用与所述待识别文件的类型对应的解析方式解析所述待识别文件,得到解析后的待识别文件;获取所述解析后的待识别文件的对象信息;确定所述对象信息中的字符串;当所述字符串中包含预设可疑字符串时,确定所述待识别文件为可疑文件。能够在不影响病毒查杀系统性能的情况下提高对病毒的识别率。
技术领域
本发明涉及文件安全技术领域,具体涉及一种文件识别方法、装置、设备及存储介质。
背景技术
在计算机网络领域,越来越多的病毒会通过文件在网络中传输,严重降低了计算机网络的安全。而病毒一般需要专业人员才能识别出来,因此,为了减少恶意文件在网络中的蔓延,提出了特征码扫描方法来方便识别病毒。
特征码扫描是传统杀毒软件的主要利器,是病毒诊断方法中,扫描法的一种。特征码扫描主要是提取恶意Office文件的特征,其技术核心思想就是从新发现恶意Office样本中,根据病毒特征,人工提取出该病毒的一处或多处二进制码,该二进制码就是该类病毒的“身份”标识,即特征码。然后更新到云库中,便于用户升级。查杀的对象就是对比特征码,然后判断是否为病毒。但是,一旦病毒作者通过变形、加壳、加花、多态等技术对病毒样本进行变形,就可以轻松避过特征码扫描,所以此方法对新变种的样本会失效,需要依赖人工提取新的特征。并且随着特征码的提取,特征码数据库越来越庞大,给查杀效率带来性能的下降。
因此,有待提出一种新的文件识别方法,以在不影响病毒查杀系统性能的情况下提高对病毒的识别率。
发明内容
本发明提出了一种文件识别方法、装置、设备及存储介质,提供了一种新的文件识别方案,能够在不影响病毒查杀系统性能的情况下提高对病毒的识别率。本发明具体是以如下技术方案实现的:
一方面,本发明提供了一种文件识别方法,包括:
确定待识别文件的类型;
利用与所述待识别文件的类型对应的解析方式解析所述待识别文件,得到解析后的待识别文件;
获取所述解析后的待识别文件的对象信息;
确定所述对象信息中的字符串;
当所述字符串中包含预设可疑字符串时,确定所述待识别文件为可疑文件。
另一方面,本发明提供了一种文件识别装置,包括:
第一确定模块,用于确定待识别文件的类型;
解析模块,用于利用与所述待识别文件的类型对应的解析方式解析所述待识别文件,得到解析后的待识别文件;
第一获取模块,用于获取所述解析后的待识别文件的对象信息;
第二确定模块,用于确定所述对象信息中的字符串;
第三确定模块,用于当所述字符串中包含预设可疑字符串时,确定所述待识别文件为可疑文件。
在一些实施例中,所述第一确定模块还包括:
第二获取模块,用于获取所述待识别文件的文件头部中前第一数量字节的数据;
第一判断模块,用于判断所述第一数量字节的数据是否与预设第一字符串相同;
第四确定模块,用于若所述第一数量字节的数据与预设第一字符串相同,则确定所述待识别文件为第一类型。
在一些实施例中,所述第一确定模块还包括:
第三获取模块,用于获取所述待识别文件的文件头部中第二数量字节的数据;
第二判断模块,用于判断所述第二数量字节的数据是否与预设第二字符串相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910594025.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种事故主动预警的方法和系统
- 下一篇:图案化多彩薄膜,其制作方法及应用