[发明专利]一种RTF文件的解析方法及装置有效
申请号: | 201910121409.1 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109871685B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 姜澎;于涛;郭晓龙;屈亚鑫;张友旭;任光辉;毕磊;申金娟;吴彬;苏蒙;崔精兵;郭长宇;赵子云;王玥 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F16/903 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 rtf 文件 解析 方法 装置 | ||
1.一种RTF文件的解析方法,其特征在于,包括:
获取待解析RTF文件;
将所述待解析RTF文件中的字符与所述RTF文件对应的有效标签集合进行比对,确定所述待解析RTF文件中的有效标签;
去除所述待解析RTF文件中的有效标签;
根据所述待解析RTF文件中子文件的属性信息,确定预设字符;
将所述预设字符与去除所述有效标签的待解析RTF文件进行比对,确定所述待解析RTF文件中的有效字符;
过滤所述去除所述有效标签的待解析RTF文件中除所述有效字符之外的混淆字符,生成目标文件;
将预设头部标识与所述目标文件中的字符进行匹配;
在确定所述目标文件中包含与所述预设头部标识匹配的字符时,从所述目标文件中确定出所述预设头部标识对应的域操作符;
将所述预设头部标识对应的域操作符内的字符确定为目标子文件。
2.如权利要求1所述的方法,其特征在于,还包括:
将所述目标文件转化为二进制格式的文件。
3.如权利要求1或2所述的方法,其特征在于,所述将所述预设头部标识对应的域操作符内的字符确定为目标子文件之后,还包括:
对所述目标子文件进行逻辑检测;
在确定所述目标子文件满足预设逻辑时,将所述目标子文件确定为正常文件,否则,将所述目标子文件确定为恶意文件。
4.如权利要求3所述的方法,其特征在于,所述获取待解析RTF文件,包括:
识别待解析文件的文件类型;
在确定所述待解析文件的文件类型为RTF文件时,获取待解析RTF文件。
5.一种RTF文件的解析装置,其特征在于,包括:
获取模块,用于待解析RTF文件;
处理模块,用于将所述待解析RTF文件中的字符与所述RTF文件对应的有效标签集合进行比对,确定所述待解析RTF文件中的有效标签;去除所述待解析RTF文件中的有效标签;根据所述待解析RTF文件中子文件的属性信息,确定预设字符;将所述预设字符与去除所述有效标签的待解析RTF文件进行比对,确定所述待解析RTF文件中的有效字符;过滤所述去除所述有效标签的待解析RTF文件中除所述有效字符之外的混淆字符,生成目标文件;
匹配模块,用于将预设头部标识与所述目标文件中的字符进行匹配;在确定所述目标文件中包含与所述预设头部标识匹配的字符时,从所述目标文件中确定出所述预设头部标识对应的域操作符;
解析模块,用于将所述预设头部标识对应的域操作符内的字符确定为目标子文件。
6.如权利要求5所述的装置,其特征在于,所述处理模块还用于:
将所述目标文件转化为二进制格式的文件。
7.一种终端设备,其特征在于,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行权利要求1~4任一权利要求所述方法的步骤。
8.一种计算机可读介质,其特征在于,其存储有可由终端设备执行的计算机程序,当所述程序在终端设备上运行时,使得所述终端设备执行权利要求1~4任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910121409.1/1.html,转载请声明来源钻瓜专利网。