[发明专利]网络上传文件中敏感轨迹的检测系统无效
申请号: | 201410668638.2 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104375983A | 公开(公告)日: | 2015-02-25 |
发明(设计)人: | 沈智广 | 申请(专利权)人: | 无锡科思电子科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 许方 |
地址: | 214028 江苏省无*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 上传 文件 敏感 轨迹 检测 系统 | ||
技术领域
本发明涉及安全文件上传领域,特别是网络上传文件中敏感轨迹的检测系统。
背景技术
随着网络的开发,用户可以在网上自由发表言论,虽然这样可以获得更全面的信息,但这样也使得网络上一些不好的言论,严重的甚至会引起恐慌,这样对于网络中上传的文件要进行严格的监控。
如果各个终端服务器需要人工进行文件内容筛查,这样不仅效率很低而且浪费人力资源,为了提高效率,目前,各个终端常用的方法为在服务器上设置关键词,通过对上传文件内容进行关键词屏蔽以达到监控的效果。
如申请号“200710308404.7 ”发明名称“针对不良短消息的关键词防范方法” 本发明提供了一种针对不良短消息的关键词防范方法,包括如下步骤:(1)运营商或者业务提供商预先提供一份针对不良短消息的关键词列表,关键词列表的每个条目包括两项内容:关键词、关键词的出现概率;(2)用户获得关键词列表的全部内容或者一个子集;(3)将已获得的关键词合并到用户手机内部的关键词列表中;(4)用户手机根据关键词列表直接过滤包含关键词的短消息。本发明有效补充了原有“关键词方法”在实用性方面存在的不足。
申请号“201210479196.8”发明名称“基于关键词权值的文本过滤方法” 本申请提供了一种基于关键词权值的文本过滤方法,该方法包括以下步骤:计算关键词的权值;以及基于所计算出的关键词的权值对文本进行过滤;其中,计算关键词权值的步骤包括:判断所述关键词是否是全新关键词,如果是,则计算历史判定数据中的正确判定数据的条数和错误判定数据的条数、以及包含所述关键词的正确判定数据的条数和错误判定数据的条数;以及计算所述关键词的权值。此外,本申请还提供了一种基于关键词权值的文本过滤系统。
虽然通过单一关键词和关键词的权值可以有效的对不良信息进行屏蔽,但这样也使得一些上传文件中仅存在单一关键词且不属于不良消息的文件也同样被屏蔽。
发明内容
本发明所解决的技术问题在于提供一种网络上传文件中敏感轨迹的检测系统,该系统利用敏感轨迹匹配来实现对上传文件中的敏感词汇进行验证。
实现本发明目的的技术解决方案为:本发明网络上传文件中敏感轨迹的检测系统,具体包括:
敏感词汇库,用于存储敏感词汇;
敏感轨迹集,用于存储敏感轨迹,其中每一条敏感轨迹由至少两个敏感词汇组成,且敏感词汇具有有向性,相邻两个敏感词汇之间的字符间距阈值为M,M为正整数;
文件监控模块,用于监控有文件上传时触发查找模块工作;
查找模块,用于通过查找上传文件中是否包含敏感词汇来触发第一判断模块工作;
第一判断模块,用于判断上传文件中包含的敏感词汇的数量至少为两个时触发提取模块工作;
提取模块,用于从该上传文件中按顺序提取敏感词汇及其当前所处字符位置;
待检测敏感轨迹形成模块,用于将提取的敏感词汇按照顺序形成待检测敏感轨迹;
敏感轨迹匹配模块,用于将待检测敏感轨迹与敏感轨迹集中每一条敏感轨迹进行匹配,并在匹配成功后触发第二判断模块工作;
第二判断模块,用于判断待检测敏感轨迹中相邻两个敏感词汇之间的字符间距是否小于等于字符间距阈值M,并在确定小于等于字符间距阈值M后触发敏感轨迹确定模块工作;
敏感轨迹确定模块,用于经敏感轨迹匹配模块匹配成功且第二判断模块确定待检测敏感轨迹中相邻两个敏感词汇之间的字符间距小于等于字符间距阈值M下确定待检测敏感轨迹即为该上传文件中的敏感轨迹。
进一步的优选方案,本发明网络上传文件中敏感轨迹的检测系统中,还包括存储模块,所述存储模块用于存储敏感词汇库和敏感轨迹集。
进一步的优选方案,本发明网络上传文件中敏感轨迹的检测系统中,提取模块中按顺序提取为从文件第一个字符开始。
进一步的优选方案,本发明网络上传文件中敏感轨迹的检测系统中,字符间距阈值M为20。
进一步的优选方案,本发明网络上传文件中敏感轨迹的检测系统中,敏感轨迹匹配模块的匹配过程:敏感轨迹中包含待检测敏感轨迹即为该待检测敏感轨迹与敏感轨迹匹配成功。
本发明与现有技术相比,其显著优点:
(1)通过设置敏感轨迹集,在上传文件中查找敏感词汇并将按顺序提取敏感词汇及其当前所处字符位置,将提取的敏感词汇按提取顺序构成待检测敏感轨迹,将待检测敏感轨迹与敏感轨迹集中的每条敏感轨迹逐一匹配可以提高关联关键词的查找速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡科思电子科技有限公司,未经无锡科思电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410668638.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于RFID的叉车速度监控系统
- 下一篇:多孔调色剂及其制备方法