[发明专利]低俗图的集成学习分类方法、装置、设备及存储介质有效

专利信息
申请号: 201910960412.2 申请日: 2019-10-10
公开(公告)号: CN112651413B 公开(公告)日: 2023-10-17
发明(设计)人: 祁小玉;刘林;阴凉;唐楠;李小康;张人愉;刘云政;王巧华 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F18/24 分类号: G06F18/24;G06N20/20;G06F18/214
代理公司: 北京品源专利代理有限公司 11332 代理人: 孟金喆
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 低俗 集成 学习 分类 方法 装置 设备 存储 介质
【说明书】:

本申请实施例公开了一种低俗图的集成学习分类方法、装置、设备及存储介质,涉及集成学习技术领域。具体实现方案为:通过语义以及图像检索的方式,在线上图集中获取与识别场景匹配的待识别图集,线上图集与搜索引擎相关联;在待识别图集中,通过自训练的专用低俗图分类模型获取与识别场景匹配的场景低俗图。本申请实施例的方案实现了精准的识别出特定的识别场景中的低俗图,减少了网络上的低俗图数量。

技术领域

本申请实施例涉及计算机技术领域,尤其涉及机器学习技术领域,具体涉及一种低俗图的集成学习分类方法、装置、设备及存储介质。

背景技术

随着互联网技术的发展,网络上出现了大量的低俗图,当用户使用搜索引擎进行信息搜索时,可以会因为搜索词构造不当,获取是低俗图的恶意曝光,使得搜索结果中会包括有低俗图。这不但影响青少年用户的身心健康,也极大地影响了用户的体验感。

现有的低俗图分类方法主要是针对通用场景的低俗图分类。通过使用通用场景的低俗图分类方法,可以识别出广义理解的低俗图,但是,实现上,随时网络技术的不断发展,出现了越来越多特定场景的低俗图,例如,医疗场景下的器官图等。在利用通用场景的低俗图分类技术直接对特定的识别景的低俗图进行分类时,会使得识别准确率以及召回率(也即,准召率)偏低,进而会造成正常图片的误识别而造成线上消费损失过大,以及线上大量特定场景的低俗图被暴露出来等问题。

发明内容

本申请实施例提供一种低俗图的集成学习分类方法、装置、设备及存储介质,提高了特定的识别场景中低俗图的分类准确率,减少了网络上低俗图的数量。

第一方面,本申请实施例提供了一种低俗图的集成学习分类方法,该方法包括:

通过语义以及图像检索的方式,在线上图集中获取与识别场景匹配的待识别图集,所述线上图集与搜索引擎相关联;

在所述待识别图集中,获取与所述识别场景匹配的场景低俗图。

可选的,通过语义以及图像检索的方式,在线上图集中获取与识别场景匹配的待识别图集,包括:

将所述线上图集中的各线上图的图像周边文本,与专有名词集中的各专有名词进行匹配,并将匹配的线上图加入至所述待识别图集中;

将所述线上图集中的各线上图与低俗图集中的各低俗图分别进行图像特征信息,以及图像周边文本特征信息间的匹配,并将匹配的线上图加入至所述待识别图集中;

其中,所述专有名词集与所述识别场景匹配,所述低俗图集与所述识别场景匹配。

这样设置的好处在于:将线上图集中的各线上图与低俗图集中的各低俗图分别进行图像特征信息以及图像周边文本特征信息的匹配,可以提高低俗图的识别准确率。

可选的,将所述线上图集中的各线上图与低俗图集中的各低俗图分别进行图像特征信息,以及图像周边文本特征信息间的匹配,并将匹配的线上图加入至所述待识别图集中,包括:

将所述线上图集中各线上图的图像周边文本特征信息,与所述低俗图集中各低俗图的图像周边文本特征信息进行匹配,获取匹配的线上图加入至第一图像集合;

将所述线上图集中各线上图的图像特征信息,与所述低俗图集中各低俗图的图像特征信息进行匹配,获取匹配的线上图加入至第二图像集合;

获取所述第一图像集合与所述第二图像集合的图像交集;

将所述图像交集与所述识别场景的场景意图进行匹配,并将匹配的图像加入至所述待识别图集中。

可选的,通过语义以及图像检索的方式,在线上图集中获取与识别场景匹配的待识别图集,还包括:

使用通用低俗图识别工具,对所述线上图集中的各线上图进行识别,并将识别出的线上图加入至所述待识别图集中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910960412.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top