[发明专利]敏感词过滤方法和装置有效
申请号: | 201710150578.9 | 申请日: | 2017-03-14 |
公开(公告)号: | CN107066543B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 王鹏跃;张鹏翼;张菊元 | 申请(专利权)人: | 北京潘达互娱科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 刘戈 |
地址: | 100041 北京市石景山*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 敏感 过滤 方法 装置 | ||
本发明实施例提供一种敏感词过滤方法和装置,该方法包括:若接收到待发送数据,则从第一内存空间中读取第一预设词库,第一预设词库被预加载至第一内存空间中长久存储;使用第一预设词库对待发送数据进行敏感词过滤处理;若过滤结果表示待发送数据中含有敏感词,则删除待发送数据。由于第一预设词库常驻在内存空间中,可以快速地获取到该第一预设词库完成敏感词过滤处理,尤其当需要对大量的待发送数据进行高并发的敏感词过滤处理时,能够更加显著地提高过滤效率。
技术领域
本发明涉及互联网技术领域,尤其涉及一种敏感词过滤方法和装置。
背景技术
随着互联网技术的发展,近年来,人们通过手机终端等智能终端设备观看网络视频、使用各种社交软件等已经成为人们的一种常见娱乐休闲方式。
为了提高在观看视频同时的参与度,提高用户体验,目前,诸如发弹幕、聊天室等交互方式已经较为普遍地被使用。以网络视频直播场景为例,由于观看某直播的直播视频的用户众多,一个用户发表的言论是主播和其他观看用户都可见的。为了保证网络直播应用的健康性,往往需要对每个用户发表的言论进行敏感词过滤,以滤出低俗的、政治敏感的等言论。
但是,随着使用某网络应用比如网络视频直播的用户数量的不断增加以及用户通过发表言论参与互动的程度的不断增长,应用服务器进行高并发大量言论的敏感词过滤的处理压力将会很大,处理效率很可能会很低。
发明内容
有鉴于此,本发明实施例提供一种敏感词过滤方法和装置,用以提高敏感词过滤的处理效率。
本发明实施例提供一种敏感词过滤方法,包括:
若接收到待发送数据,则从第一内存空间中读取第一预设词库,所述第一预设词库被预加载至所述第一内存空间中长久存储;
使用所述第一预设词库对所述待发送数据进行敏感词过滤处理;
若过滤结果表示所述待发送数据中含有敏感词,则删除所述待发送数据。
本发明实施例提供一种敏感词过滤装置,包括:
读取模块,用于若接收到待发送数据,则从第一内存空间中读取第一预设词库,所述第一预设词库被预加载至所述第一内存空间中长久存储;
过滤模块,用于使用所述第一预设词库对所述待发送数据进行敏感词过滤处理;
删除模块,用于若过滤结果表示所述待发送数据中含有敏感词,则删除所述待发送数据。
本发明实施例提供的敏感词过滤方法和装置,将第一预设词库被预加载至第一内存空间中长久存储,当接收到待发送数据时,可以直接从第一内存空间中读取第一预设词库来对待发送数据进行敏感词过滤处理,由于第一预设词库常驻在内存空间中,可以快速地获取到该第一预设词库完成敏感词过滤处理,尤其当需要对大量的待发送数据进行高并发的敏感词过滤处理时,能够更加显著地提高过滤效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的敏感词过滤方法实施例一的流程图;
图2为本发明实施例提供的敏感词过滤方法实施例二的流程图;
图3为本发明实施例提供的敏感词过滤装置实施例一的结构示意图;
图4为本发明实施例提供的敏感词过滤装置实施例二的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京潘达互娱科技有限公司,未经北京潘达互娱科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710150578.9/2.html,转载请声明来源钻瓜专利网。