[发明专利]一种敏感关键字的检测方法及系统在审
申请号: | 202211676068.2 | 申请日: | 2022-12-26 |
公开(公告)号: | CN115906827A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 邱尚振;吕晓俊;林挺;郑滋繁;章威炜 | 申请(专利权)人: | 厦门三五互联科技股份有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/126 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 邱冬新 |
地址: | 361000 福建省厦门市火炬*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 关键字 检测 方法 系统 | ||
本发明属于网络安全技术领域,本发明提供一种敏感关键字检测的方法及系统。所述方法通过特定规则去除客户提交或者发送的信息中相关非文字的字符,获得信息的纯文字内容并进行第一步敏感关键字检测,若检测结果包含敏感关键字则结束检测并将检测结果反馈给系统;若第一步检测结果不包含敏感关键字则将所述纯文字内容转化为拼音,对转化为拼音的纯文字内容进行第二步敏感关键字检测,并将检测结果反馈给系统,以达到系统对用户提交或发送的信息进行敏感关键字检测的目的。
技术领域
本发明涉及网络安全技术领域,尤其是涉及一种敏感关键字的检测方法及系统。
背景技术
随着大数据时代的到来,数据开始呈现爆炸式的增长,给网络信息的检测和过滤带来严峻的考验。然而现有技术针对敏感词的检测和过滤通常仅判断文本中是否包含关键字,用户有较多的方法绕过这种检索。用户在发送含有敏感词的时候可能会使用标点符号,或者使用同音字、拼音替代。为了防止用户谈论敏感话题,需要对敏感词进行更精准的检测,不仅仅需要在敏感词列表中添加关键字,同时需要将关键词的拼音保存在敏感词列表。
发明内容
本发明提供了一种敏感关键字的检测方法及系统,旨在解决避免用户提交或发送的信息包含敏感关键字的问题。
为实现上述目的,本发明提供了一种敏感关键字的检测方法,所述方法包含:
通过客户端收集用户提交或发送的信息,获取所需检测的信息;
通过特定规则去除所述信息中相关非文字的字符,获得所述信息的纯文字内容;
对所述纯文字内容进行敏感关键字检测,并根据纯文字内容的检测结果进行下一步流程;
将所述纯文字内容转化为拼音,获得所述信息的拼音内容;
对所述信息的拼音内容进行敏感关键字拼音检测,获得拼音内容的检测结果;
根据检测结果向系统反馈用户信息是否包含敏感关键字。
进一步地,所述通过特定规则去除所述信息中相关非文字的字符,获得所述信息的纯文字内容包含:
去除所述信息中的空格;
去除所述信息中的换行;
去除所述信息中的标点符号;
去除所述信息中的非汉字编码。
进一步地,所述对所述纯文字内容进行敏感关键字检测,并根据纯文字内容的检测结果进行下一步流程包含:
根据所述纯文字内容的检测结果进行判定,若检测结果包含敏感关键字,则结束检测并向系统反馈用户信息包含敏感关键字;若检测结果不包含敏感关键字,则进入下一流程。
进一步地,所述对所述信息的拼音内容进行敏感关键字拼音检测,获得拼音内容的检测结果包含:
将系统配置的敏感关键字进行拼音转化,获得敏感关键字的拼音内容;
通过所述敏感关键字的拼音内容对所述信息的拼音内容进行敏感关键字检测,获得所述拼音内容的检测结果。
进一步地,所述根据检测结果向系统反馈用户信息是否包含敏感关键字:
若检测结果包含敏感关键字,则向系统反馈用户信息包含敏感关键字;若检测结果不包含敏感关键字,则向系统反馈客户信息不包含敏感关键字。
为实现上述目的,本发明还提供了一种敏感关键字的检测系统,所述系统包含:
信息获取模块,用于通过客户端收集用户提交或发送的信息,获取所需检测的信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门三五互联科技股份有限公司,未经厦门三五互联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211676068.2/2.html,转载请声明来源钻瓜专利网。