[发明专利]一种基于关键字的敏感词智能过滤方法在审
申请号: | 201711369633.X | 申请日: | 2017-12-06 |
公开(公告)号: | CN110019680A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 陈飞 | 申请(专利权)人: | 杭州米络科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/903;G06F16/958 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感词 智能过滤 敏感词检测 字符串匹配 语义 人工参与 通信领域 网站数据 用户评论 自动对比 字符串 算法 捕获 词语 字典 检索 留言 自动化 应用 环节 配合 分析 | ||
1.一种基于关键字的敏感词智能过滤方法,其特征在于,包括如下步骤:步骤1,用户在后台预先定义好需要过滤的敏感词的一般写法和这个词的有效期;步骤2,定义敏感词中每个字的其他写法或相应的写法,本方法中这种写法称为别名;步骤3,程序根据当前定义的敏感词和相关别名生产最终的特征词库供客户端程序调用;步骤4,用户运行程序并自动加载最新的特征词库列表;步骤5,用户在相应的输入框中输入一段字符串;步骤6,用特征词库列表中相应特征词检索用户输入的字符串,并给出相应的断言结果;步骤7,若断言结果为不合法,则使用重新输入或其他方式处理,若断言为合法,则继续执行之后的步骤。
2.根据权利要求1所述的一种基于关键字的敏感词智能过滤方法,其特征在于,步骤1中用户在后台预先定义的敏感词一般写法,在本方法中所指的“一般写法”是指日常中使用的名称写法,比如:“一二三”、“中国”,而非“壹二三”、“中國”这些写法,此处只需要使用日常书写的文字即可,本方法不局限于“一二三”、“中国”过滤词,能根据需求增减敏感词。
3.根据权利要求1所述的一种基于关键字的敏感词智能过滤方法,其特征在于,所述的步骤2中的文字其他写法或相应写法,在本方法中所指的是比如:“一”的其他写法有:“壹”,相应写法有:数字“1”,希腊字母“I”,序号“①”、“(1)”等,以上写法在本方法中统称为“一”的别名,别名是本方法中重要的组成部件之一,管理员可以为每个有别名的字设置好相应的别名,每个别名只需要被设置一次即可,比如已经设置关键字“中国”中“国”字的别名,就不需要再设置关键字“国家”中“国”字的别名,本方法中不局限于“一”字、“国”字的别名,能根据需求增减别名字。
4.根据权利要求1所述的一种基于关键字的敏感词智能过滤方法,其特征在于,所述的步骤6中特征词库列表是通过计算和逻辑关系判断产生的一组用标准正则表达式表示的被抽象了的敏感词列表,特征词库列表主要部件之一,网站、客户端及相应的端口接入程序只需要从服务器获取这个特征词列表,循环列表并逐一用标准正则表达式的相关方法去检查步骤5中用户输入的字符串即可,若检查到结果为真,则表示用户输入了包含了敏感词的内容。
5.根据权利要求1所述的一种基于关键字的敏感词智能过滤方法,其特征在于,所述的步骤7中当断言若为不合法,不局限于提示用户重新输入,此处程序能自由处理这个逻辑,例将敏感词替换成“***”,凡是根据特征词列表断言得出的结果再进行之后逻辑操作或计算的都应该是其特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州米络科技有限公司,未经杭州米络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711369633.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:食品药品监管方法和装置
- 下一篇:一种评论内容过滤方法及系统