[发明专利]安全类别标签检测方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202110762951.2 申请日: 2021-07-06
公开(公告)号: CN113449109A 公开(公告)日: 2021-09-28
发明(设计)人: 吴智东 申请(专利权)人: 广州华多网络科技有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/289;G06F40/30;G06F40/216
代理公司: 广州利能知识产权代理事务所(普通合伙) 44673 代理人: 王增鑫
地址: 511442 广东省广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 安全 类别 标签 检测 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请公开一种安全类别标签检测方法、装置、计算机设备及存储介质,包括:获取待检测安全类别标签的文本信息;调用序列标注模型为文本信息标注文本信息中的关键词及关键词所属的安全类别标签,根据各安全类别标签所标注的关键词计算该文本信息分别属于各安全类别标签的分词评估分值;调用文本分类模型为文本信息进行分类评估,获得该文本信息分别命中所述各个安全类别标签的全文评估分值;将各个安全类别标签相对应的两种分值进行线性融合,获得文本信息分别属于各个安全类别标签的综合评估分值,确定综合评估分值最大者为文本信息的安全类别标签。本申请通过融合两种标签分类模型,从词组及全文的维度精准地检测文本信息的安全类别。

技术领域

发明实施例涉及信息安全领域,尤其是一种安全类别标签检测方法、装 置、计算机设备及存储介质。

背景技术

在现有的技术中,较多是使用违规关键词,对信息内容进行匹配,当匹配 内容中存在的关键词,结合白名单进行判断内容是否违规;也有部分技术,计 算了信息文本与数据库中黑名单内容的文本相似性,当相似度高于阈值时,则 判断内容违规。

通过关键词匹配的方法,忽略了文本之间的语义信息,召回出来的数据大 多数是与违规类别不相关的噪声数据。而通过相似度的方法,则非常依赖于收 集的样本库,当信息文本出现了数据库中不存在的样本,那么该方法很大可能 会出现漏召回的情况。因此,如何提高推送的信息文本的违规检测的质量,成 为需要本领域技术人员解决的技术问题。

发明内容

本申请的目的在于克服现有技术的至少部分不足而提供一种安全类别标签 检测方法、装置、计算机设备及存储介质。

为实现本申请的目的,采用如下技术方案:

适应本申请的目的之一而提出的一种安全类别标签检测方法,包括如下步 骤:

获取待检测安全类别标签的文本信息;

调用序列标注模型为所述文本信息标注文本信息中的关键词及关键词所属 的安全类别标签,根据各安全类别标签所标注的关键词计算该文本信息分别属 于各安全类别标签的分词评估分值,所述序列标注模型被预先训练至收敛状态;

调用文本分类模型为所述文本信息进行分类评估,获得该文本信息分别命 中所述各个安全类别标签的全文评估分值,所述文本分类模型被预先训练至收 敛状态;

将各个安全类别标签相对应的分词评估分值与全文评估分值进行线性融 合,获得所述文本信息分别属于各个安全类别标签的综合评估分值,确定综合 评估分值最大者为所述文本信息的安全类别标签。

进一步的实施例中,获取待检测安全类别标签的文本信息的步骤,包括: 响应文本信息提交事件,提取其中的文本信息,该文本信息包含待发布广告的 内容文本、待发布公告的内容文本或待发表文章的内容文本;

而在确定综合评估分值最大者为所述文本信息的安全类别标签之后,包括 如下步骤:判断所述安全类别标签的安全属性,当其为非安全属性时,禁止发 布该文本信息;当其为安全属性时,允许发布该文本信息。

进一步的实施例中,调用序列标注模型为所述文本信息标注文本信息中的 关键词及关键词所属的安全类别标签,根据各安全类别标签所标注的关键词计 算该文本信息分别属于各安全类别标签的分词评估分值,包括如下具体步骤:

将所述文本信息导入序列标注模型中进行基于语义特征的关键词提取,获 得表征为语义向量的关键词序列;

所述序列标注模型基于所述语义向量对关键词序列进行标签预测,获得描 述各个关键词相对应的安全类别标签的标签序列;

所述序列标注模型根据所述标签序列中属于非安全属性的安全类别标签所 对应的关键词计算该文本信息分别属于各安全类别标签的分词评估分值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华多网络科技有限公司,未经广州华多网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110762951.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top