[发明专利]一种RTF文件的解析方法及装置有效
申请号: | 201910121409.1 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109871685B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 姜澎;于涛;郭晓龙;屈亚鑫;张友旭;任光辉;毕磊;申金娟;吴彬;苏蒙;崔精兵;郭长宇;赵子云;王玥 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F16/903 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 rtf 文件 解析 方法 装置 | ||
本发明实施例提供了一种RTF文件的解析方法及装置,涉及数据处理技术领域,该方法包括:在对RTF文件进行病毒查杀时,先对RTF文件进行降维处理,生成目标文件,再将预设头部标识与目标文件中的字符进行匹配,在确定目标文件中包含与预设头部标识匹配的字符时,从目标文件中确定出预设头部标识对应的域操作符,最后将预设头部标识对应的域操作符内的字符确定为目标子文件,由于先对RTF文件进行降维处理,简化了RTF文件的内容,故在检测RTF文件中的目标子文件时,避免了无效字符的干扰,从而降低了检测难度,同时提高了检测准确性。通过对目标子文件进行逻辑检测,确定目标子文件是否为恶意文件,提高对病毒和攻击的防御能力。
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种RTF文件的解析方法及装置。
背景技术
目前流行的攻击技术通常会包含一个高度混淆的多信息文本格式(Rich TextFormat,简称RTF)文件,该类高度混淆的RTF文件的内容杂乱无章,没有任何规律。当这些RTF中嵌入了恶意的对象连接与嵌入(Object Linking and Embedding,简称OLE)文件、压缩(zip)文件或者vbe文件等子文件时,因文件高度混淆,反病毒引擎往往很难正确的检测出该类RTF文件中嵌入的子文件,因此也无法进一步检测嵌入的子文件是否为恶意子文件。恶意子文件在正常设备上运行时,将扰乱正常设备的操作,给正常设备的安全带来威胁。
发明内容
由于在高度混淆的RTF文件中,反病毒引擎往往很难正确的检测到RTF文件中嵌入的子文件,因此也无法进一步检测嵌入的子文件是否为恶意子文件,导致恶意子文件扰乱正常设备的操作,给正常设备的安全带来威胁的问题,本发明实施例提供了一种RTF文件的解析方法及装置。
一方面,本发明实施例提供了一种RTF文件的解析方法,该方法包括:
获取待解析RTF文件;
对所述待解析RTF文件进行降维处理,生成目标文件;
将预设头部标识与所述目标文件中的字符进行匹配;
在确定所述目标文件中包含与所述预设头部标识匹配的字符时,从所述目标文件中确定出所述预设头部标识对应的域操作符;
将所述预设头部标识对应的域操作符内的字符确定为目标子文件。
一方面,本发明实施例提供了一种RTF文件的解析装置,该装置包括:
获取模块,用于待解析RTF文件;
处理模块,用于对所述待解析RTF文件进行降维处理,生成目标文件;
匹配模块,用于将预设头部标识与所述目标文件中的字符进行匹配;在确定所述目标文件中包含与所述预设头部标识匹配的字符时,从所述目标文件中确定出所述预设头部标识对应的域操作符;
解析模块,用于将所述预设头部标识对应的域操作符内的字符确定为目标子文件。
一方面,本发明实施例提供了一种终端设备,该设备包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行RTF文件的解析方法的步骤。
一方面,本发明实施例提供了一种计算机可读介质,其存储有可由终端设备执行的计算机程序,当所述程序在终端设备上运行时,使得所述终端设备执行RTF文件的解析方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910121409.1/2.html,转载请声明来源钻瓜专利网。