[发明专利]数据的审核方法和装置、存储介质及电子装置有效
申请号: | 202210560088.7 | 申请日: | 2022-05-23 |
公开(公告)号: | CN114637896B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 彭垚;倪华健;林亦宁;赵之健 | 申请(专利权)人: | 杭州闪马智擎科技有限公司 |
主分类号: | G06F16/9035 | 分类号: | G06F16/9035;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 刘旺贵 |
地址: | 310000 浙江省杭州市西湖区文*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 审核 方法 装置 存储 介质 电子 | ||
本发明公开了一种数据的审核方法和装置、存储介质及电子装置,其中,上述方法包括:获取待审核的第一审核数据;将第一审核数据输入到K级审核模型中,以使K级审核模型中的第一级审核网络对第一审核数据进行数据审核,直至通过第K级审核网络得到第一审核数据的审核结果,其中,K级审核模型包括级联的K个审核网络,对于K级审核网络中的任一审核网络,第N级审核网络的输入为第N‑1级审核网络的输出,第N级审核网络的复杂度为第N‑1级审核网络的复杂度的目标倍数,K为大于1的整数,N为大于1,且小于或等于K的整数。解决了无法实现对待审核数据高效精准的审核,以将待审核数据中非正常的数据进行去除等问题。
技术领域
本发明实施例涉及数据处理领域,具体而言,涉及一种数据的审核方法和装置、存储介质及电子装置。
背景技术
随着信息时代的快速发展,特别是网络时代的到来,每天都有上亿,甚至数十亿的图像、文字、语音、视频等多媒体信息内容被上传到互联网,同时在这些信息当中还掺杂着很多敏感的信息,比如涉黄、涉暴、涉政等违规信息。因此除了人工审核之外,大部分数据是通过数据审核系统完成审核的。
常规的数据审核系统设计思路是建立一个强大的敏感内容过滤审核模块,该模块能同时分析图像、文字、语音、视频等多种不同媒介的数据并进行计算,通常都是采用深度学习技术加以实现。由于敏感内容数据的多样性和不规律性,往往需要一些计算复杂度较高的深度学习网络模型才能达到比较好的效果,复杂度越高,效果则越好。但是,随着计算复杂度的上升,数据处理的吞吐量便会下降,要想维持恒定的系统吞吐量,只能变相的增加相应的硬件成本才能做到;另外一种设计思路是先构建一个计算复杂度较小的审核模块,用于拦截部分正常内容的数据,起到分流的功能,然后再把剩下的可能存在敏感内容的数据输送给高计算复杂度的审核模块做二次分析,从而减小整体计算开销,提升吞吐量。但是这种思路存在一些局限性,一方面,计算复杂度较小的审核模块相对来说,精度会差一些,导致能被分流掉的数据量占比不高,高计算复杂度的审核模块依旧要处理较多的数据。另一方面,两个计算复杂度不同的模块之间也没有相应的关联信息存在,即两个模块是独立存在的,因而不能粗暴的将两个模块结合到一起。因此,迫切需要高效精准的审核系统对这些不健康的数据进行踢出,以呈现出健康的上网环境。
针对相关技术中,无法实现对待审核数据高效精准的审核,以将待审核数据中非正常的数据进行去除等问题,尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种数据的审核方法和装置、存储介质及电子装置,以至少解决相关技术中,无法实现对待审核数据高效精准的审核,以将待审核数据中非正常的数据进行去除等问题。
根据本发明实施例的一个实施例,提供了一种数据的审核方法,包括:获取待审核的第一审核数据;将第一审核数据输入到K级审核模型中,以使K级审核模型中的第一级审核网络对第一审核数据进行数据审核,直至通过第K级审核网络得到第一审核数据的审核结果,其中,K级审核模型包括级联的K个审核网络,对于K级审核网络中的任一审核网络,第N级审核网络的输入为第N-1级审核网络的输出,第N级审核网络的复杂度为第N-1级审核网络的复杂度的目标倍数,K为大于1的整数,N为大于1,且小于或等于K的整数。
在一个示例性实施例中,将第一审核数据输入到K级审核模型中,以使K级审核模型中的第一级审核网络对第一审核数据进行数据审核,直至通过第K个审核网络得到第一审核数据的审核结果,包括:将第一审核数据输入到K级审核模型中的第一级审核网络进行数据审核,得到第一级审核网络输出的第一标注结果;在第一标注结果中存在敏感数据类型的情况下,确定出第一审核数据中敏感数据类型对应的敏感数据,并将敏感数据作为第二审核数据;将第二审核数据输入到K级审核模型中的第二级审核网络进行数据审核,得到第二级审核网络输出的第二标注结果;在K级审核模型中所有级别的审核网络完成数据审核后,输出第一审核数据的审核结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州闪马智擎科技有限公司,未经杭州闪马智擎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210560088.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置