[发明专利]一种敏感图片检测方法、装置及电子设备有效
申请号: | 202010453484.0 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111814822B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 游福成;赵帅;王少梅;孙德志;陈京京 | 申请(专利权)人: | 北京印刷学院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;H04L9/40;G06F40/289;G06F40/30;H04N1/44 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 王刚 |
地址: | 102600 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 图片 检测 方法 装置 电子设备 | ||
本发明提供一种敏感图片检测方法、装置及电子设备,对敏感图片检测时具有检测速度快、效率高和误检漏检率低的优点。所述方法包括:获取网络图片数据与网络敏感词,构建图片数据集与动态敏感词库;根据所述图片数据集构建并训练优化图片语义描述模型;利用优化后的图片语义描述模型对待测目标图片进行处理,确定图像语义信息;根据动态敏感词库对所述图像语义信息进行敏感信息检测,对所述待测目标图片进行检测过滤。所述敏感图片检测装置,包括:数据准备模块、模型构建模块、图片处理模块及敏感过滤模块。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行并执行所述敏感图片检测方法的程序。
技术领域
本说明书一个或多个实施例涉及网络信息安全技术领域,尤其涉及一种敏感图片检测方法、装置及电子设备。
背景技术
随着互联网信息技术的迅速发展,网络媒体已经成为人们工作生活中重要的信息传播途径和交流平台,但是由于网络信息传播速度快、影响范围广,一旦敏感信息通过网络途径传播,会产生较大的负面影响。在各种不同的网络信息传播方式中,以图片作为信息载体的传播方式占了非常大的比重,不法分子往往将敏感信息伪装成图片或将敏感信息影藏在图片中进行传播,这无疑会大大增加敏感信息的检测难度。
图片中隐藏敏感信息的方式繁多,图片中任意元素的位置、形式、组成等发生微小的变化,都会对敏感信息检测结果造成影响,并且图片中往往可能存在各种无意义的信息干扰项,也尝尝会对敏感信息结果造成误导。现有的对敏感图片的检测方法,很大程度上还是依赖于人工检测或简单的计算机分类检测,这种检测方式普遍存在检测速率低、效率差、误检率高的问题。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种敏感图片检测方法、装置、电子设备及存储介质,以解决现有检测方法中存在的检测速度低、效率差、误检率高和漏检率高的问题。
基于上述目的,本说明书一个或多个实施例提供了一种敏感图片检测方法,包括:
获取网络图片数据与网络敏感词,分别构建图片数据集与动态敏感词库,所述图片数据包括图像以及相应的图像描述;
构建图片语义描述模型,并利用所述图片数据集对所述图片语义描述模型进行训练优化;
利用优化后的所述图片语义描述模型对待测目标图片进行处理,确定所述待测目标图片相应的图像语义信息;
根据动态敏感词库对所述图像语义信息进行敏感信息检测,确定所述待测目标图片的敏感度值,根据所述敏感度值对所述待测目标图片进行检测过滤。
可选的,所述构建动态敏感词库,包括:
采集当前网络中的敏感词数据,将所述敏感词数据录入所述动态敏感词库,所述敏感词数据包括敏感词以及相应的敏感因子;
设定更新周期,按照所述更新周期对所述动态敏感词库进行增量更新。
可选的,所述按照所述更新周期对所述动态敏感词库进行增量更新,包括:
在每次更新时,获取更新时刻下网络中的敏感词数据;
将更新时刻下网络中的敏感词数据与所述动态敏感词库中的敏感词数据进行比对;
根据比对结果,采用确定有穷自动机算法,确定更新前的初态数据与更新后的终态数据,并确定所述终态数据与所述初态数据间的连接关系;
根据所述连接关系将所述终态数据录入所述动态敏感词库。
可选的,所述构建图片语义描述模型,并利用所述图片数据集对所述图片语义描述模型进行训练优化,包括:
所述图片语义描述模型包括编码模块与解码模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京印刷学院,未经北京印刷学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010453484.0/2.html,转载请声明来源钻瓜专利网。