[发明专利]一种文件安全处理方法有效
申请号: | 201510792215.6 | 申请日: | 2015-11-17 |
公开(公告)号: | CN105243327B | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 陈虹宇;罗阳;苗宁 | 申请(专利权)人: | 四川神琥科技有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F21/62 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 郭霞 |
地址: | 610043 四川省成都市高新*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 安全 处理 方法 | ||
本发明提供了一种文件安全处理方法,该方法包括:判断页面文件的入侵方式,根据入侵方式确定相应的特征提取和分类过程,通过特征提取和分类过程对移动终端页面文件进行安全检测。本发明提出了一种文件检测识别方法,对不同入侵方式利用不同的分类方式进行检测,引入模糊处理防止恶意代码的伪装,提高了检测成功率。
技术领域
本发明涉及计算机数据安全,特别涉及一种文件安全处理方法。
背景技术
随着Internet的不断发展与普及,各种网络安全事件层出不穷,整个移动互联网的环境受到了严重的威胁,给社会带来了巨大的损失。网络安全事件多是黑客入侵行为引起,而内在原因是软件或文档自身的安全漏洞。入侵者利用了该漏洞,对移动设备中的页面文件进行篡改或伪装,使普通用户无法识别,借机执行或分发非法程序。现有的页面文件检测包括静态检测和动态检测,但均涉及监控文件运行时触发的函数和事件,而没有考虑入侵者使用的模糊处理技术,因而恶意脚本代码识别率很低,并且现有的检测模型使用了仿真技术,使移动设备端的计算资源消耗过大。
发明内容
为解决上述现有技术所存在的问题,本发明提出了一种文件安全处理方法,包括:
判断页面文件的入侵方式,根据入侵方式确定相应的特征提取和分类过程,通过特征提取和分类过程对移动终端页面文件进行安全检测。
优选地,所述方法还包括:在所述特征提取前,首先确定脚本代码在页面文件中的位置,从页面文件中将脚本代码提取出来,如果该脚本代码经过编码、压缩和模糊等理,则还原原始的脚本代码,最后根据特征提取算法提取特征向量集;
所述根据入侵方式确定相应的特征提取和分类过程,进一步包括,对于基于脚本代码入侵的页面文件,提取特征是基本单位为词;对于基于非脚本代码入侵方式实现的页面文件,提取特征时,将页面文件进行划分,然后进行特征提取;根据两种不同的特征提取方式,分别基于Bayes分类过程和判定树分类过程,建立两个不同的分类模型,然后采用并联的方式,将两个分类过程进行组合。
优选地,对于基于非脚本代码入侵方式实现的页面文件,提取训练样本集的特征向量,所述训练样本集分为两类,基于非脚本代码入侵的恶意文件样本集和不含脚本代码的安全文件样本集;在特征提取时,分别提取两个不同样本集的特征向量集,根据预定的特征选择算法,将两个特征向量集进行处理,以得到学习算法需要的特征向量集;然后根据学习算法和提取的特征向量集,采用判定树分类过程建立识别模型;最后对未知页面文件进行识别;在对页面文件进行识别时,提取未知页面文件的特征向量集,利用该特征向量集代替页面文件进行识别,然后将特征向量集作为识别器的输入,识别器根据己建立的识别,对特征向量集进行识别分类;最后得出未知页面文件的分类结果。
优选地,在进行非脚本代码入侵特征向量提取时,所述分别提取两个不同样本集的特征向量集进一步包括以下过程:
1.提取恶意样本集特征向量集Tm,并计算其中每个特征向量的词频tfm,i;
2.提取安全样本集特征向量集Tn并计算其中每个特征向量的词频tfn,j;
3.计算Tm中每个特征向量在所述安全样本集中的反向文件频率idfm,i;
4.计算Tn中每个特征向量在所述恶意样本集中的反向文件频率idfn,j;
5.分别选择不同样本集的特征向量集,然后合并得到非脚本代码入侵的特征向量集。
本发明相比现有技术,具有以下优点:
本发明提出了一种文件检测识别方法,对不同入侵方式利用不同的分类方式进行检测,引入模糊处理防止恶意代码的伪装,提高了检测成功率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川神琥科技有限公司,未经四川神琥科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510792215.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多数据源远程接入方法
- 下一篇:一种大功率风机防扭缆连接装置