[发明专利]一种检测网络上传文件中敏感轨迹的方法无效
申请号: | 201410668759.7 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104375984A | 公开(公告)日: | 2015-02-25 |
发明(设计)人: | 沈智广 | 申请(专利权)人: | 无锡科思电子科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 214028 江苏省无*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 网络 上传 文件 敏感 轨迹 方法 | ||
技术领域
本发明涉及安全文件上传领域,特别是一种检测网络上传文件中敏感轨迹的方法。
背景技术
随着网络的开发,用户可以在网上自由发表言论,虽然这样可以获得更全面的信息,但这样也使得网络上一些不好的言论,严重的甚至会引起恐慌,这样对于网络中上传的文件要进行严格的监控。
如果各个终端服务器需要人工进行文件内容筛查,这样不仅效率很低而且浪费人力资源,为了提高效率,目前,各个终端常用的方法为在服务器上设置关键词,通过对上传文件内容进行关键词屏蔽以达到监控的效果。
如申请号“200710308404.7 ”发明名称“针对不良短消息的关键词防范方法” 本发明提供了一种针对不良短消息的关键词防范方法,包括如下步骤:(1)运营商或者业务提供商预先提供一份针对不良短消息的关键词列表,关键词列表的每个条目包括两项内容:关键词、关键词的出现概率;(2)用户获得关键词列表的全部内容或者一个子集;(3)将已获得的关键词合并到用户手机内部的关键词列表中;(4)用户手机根据关键词列表直接过滤包含关键词的短消息。本发明有效补充了原有“关键词方法”在实用性方面存在的不足。
申请号“201210479196.8”发明名称“基于关键词权值的文本过滤方法” 本申请提供了一种基于关键词权值的文本过滤方法,该方法包括以下步骤:计算关键词的权值;以及基于所计算出的关键词的权值对文本进行过滤;其中,计算关键词权值的步骤包括:判断所述关键词是否是全新关键词,如果是,则计算历史判定数据中的正确判定数据的条数和错误判定数据的条数、以及包含所述关键词的正确判定数据的条数和错误判定数据的条数;以及计算所述关键词的权值。此外,本申请还提供了一种基于关键词权值的文本过滤系统。
虽然通过单一关键词和关键词的权值可以有效的对不良信息进行屏蔽,但这样也使得一些上传文件中仅存在单一关键词且不属于不良消息的文件也同样被屏蔽。
发明内容
本发明所解决的技术问题在于提供一种检测网络上传文件中敏感轨迹的方法,该方法利用敏感轨迹匹配来实现对上传文件中的敏感词汇进行验证后确定上传文件中是否包含敏感轨迹。
实现本发明目的的技术解决方案为:一种检测网络上传文件中敏感轨迹的方法,具体包括以下步骤:
步骤1、设置敏感词汇库,用于存储敏感词汇;
步骤2、根据敏感词汇库中的敏感词汇设置敏感轨迹集,其中每一条敏感轨迹由至少两个敏感词汇组成,且敏感词汇具有有向性,相邻两个敏感词汇之间的字符间距阈值为M,M为正整数;
步骤3、监控上传文件,查找上传文件中是否包含敏感词汇,若包含则执行步骤4,否则该上传文件中不包含敏感轨迹;
步骤4、判断该上传文件中包含的敏感词汇的数量,当仅包含一个敏感词汇时,则该上传文件中不包含敏感轨迹;当包含两个或两个以上敏感词汇时,执行步骤5;
步骤5、从该上传文件中按顺序提取敏感词汇及其当前所处字符位置,将提取的敏感词汇按照顺序形成待检测敏感轨迹后执行步骤6;
步骤6、将步骤5中获得的待检测敏感轨迹与步骤2中的敏感轨迹集中每一条敏感轨迹进行匹配,当与其中一条敏感轨迹匹配成功后,执行步骤7;
步骤7、判断待检测敏感轨迹中相邻两个敏感词汇之间的字符间距是否小于等于字符间距阈值M,若小于等于,则判定该待检测敏感轨迹即为该上传文件中的敏感轨迹;否则,判定该上传文件中不包含敏感轨迹。
进一步地优选方案,本发明检测网络上传文件中敏感轨迹的方法中,字符间距阈值M为20。
进一步地优选方案,本发明检测网络上传文件中敏感轨迹的方法中,步骤5中按顺序提取为从文件第一个字符开始查找,提取属于敏感词汇库中存储的敏感词汇。
进一步地优选方案,本发明检测网络上传文件中敏感轨迹的方法中,步骤5将提取的敏感词汇按照顺序形成待检测敏感轨迹,具体为将敏感词汇按照提取的先后顺序形成待检测敏感轨迹。
进一步地优选方案,本发明检测网络上传文件中敏感轨迹的方法中,将步骤5中获得的待检测敏感轨迹与步骤2中的敏感轨迹集中每一条敏感轨迹进行匹配,具体为:敏感轨迹中包含待检测敏感轨迹即为该待检测敏感轨迹与敏感轨迹匹配成功。
本发明与现有技术相比,其显著优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡科思电子科技有限公司,未经无锡科思电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410668759.7/2.html,转载请声明来源钻瓜专利网。