[发明专利]媒体文件审核方法及系统有效
申请号: | 202110136240.4 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112905812B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 陈正男;谢赟;黄海清;韩欣;朱王芳 | 申请(专利权)人: | 上海德拓信息技术股份有限公司 |
主分类号: | G06F16/45 | 分类号: | G06F16/45;G06F16/41 |
代理公司: | 上海中外企专利代理事务所(特殊普通合伙) 31387 | 代理人: | 孙益青 |
地址: | 200233 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体文件 审核 方法 系统 | ||
本申请公开了一种媒体文件审核方法及系统,该方法包括如下步骤:步骤1:分类收集待审核文件,所述待审核文件包括视频数据和图像数据;步骤2:将待审核文件进行迭代训练并取得目标检测模型;步骤3:通过目标检测模型将待审核文件进行检测处理,筛选出风险文件;步骤4:根据业务场景设置阈值,并基于阈值对风险文件进行过滤处理。本申请能够在大量的媒体文件中快速准确地发现存在内容安全隐患的文件,并有效的将风险文件进行拦截及执行相应操作。
技术领域
本申请属于图像处理技术领域,具体来说涉及一种对媒体文件审核方法,以及实现 该方法的审核系统。
背景技术
随着互联网的发展,用户在网络平台上传的媒体文件中,难免存在一部分不良信息, 对于相关应用和服务平台而言很容易因为以上安全隐患遭到下架关停等整改,从而使得业 务发展遭受巨大损失。因此,如何开发出一种对媒体的媒体文件审核方法,能够帮助平台 及时从海量的上传数据中筛选出不良信息的媒体文件,以保护应用平台和服务平台利益, 是本领域技术人员需要研究的方向。
发明内容
本发明的目的在于提供一种媒体文件审核方法,能够在大量的媒体文件中快速准确地 发现存在内容安全隐患的文件,并有效的将风险文件进行拦截及执行相应操作。
一种媒体文件审核方法,其包括如下步骤:
步骤1:分类收集待审核文件,所述待审核文件包括视频文件和图像文件;
步骤2:将待审核文件进行迭代训练并取得目标检测模型;
步骤3:通过目标检测模型将待审核文件进行检测处理,筛选出风险文件;
步骤4:将待审核文件进行过滤处理。
优选的,上述媒体文件审核方法中,步骤1包括:
步骤11:构建内容审核目录;
步骤12:基于内容审核目录将待审核文件进行分类收集;
步骤13:将待审核文件中的视频文件进行抽帧处理、将该视频文件转化为图像文件;
步骤14:对图像文件进行清洗和标注。所述清洗是指基于python脚本删除灰度图及四 维图;所述标注是指通过LabelImg在图像文件上标注审核类别目标的标签及坐标信息。
更优选的,上述媒体文件审核方法中,步骤2包括:
以YOLO v5目标检测模型将待审核文件进行迭代训练并取得目标检测模型。
进一步优选的,上述媒体文件审核方法中,步骤3包括:
步骤31:将图像文件输入所述目标检测模型中,训练后输出对应于各图像文件的风险 值;
步骤32:将步骤31所得风险值与预设的第一风险阈值进行比对,将高于第一风险阈值 的风险值所对应的图像文件打上风险标签。
更进一步优选的是,上述媒体文件审核方法中,步骤4包括:
步骤41:读取图像文件是否包含风险标签,若是则跳转至步骤42,若否进程结束;
步骤42:将图像文件对应的风险值与第二风险阈值进行比对,若该风险值高于第二风 险阈值,则跳转至步骤43,否则跳转至步骤44;
步骤43:若图像文件由待审核文件中的视频文件转化而成,删除该图像文件对应的视 频文件;否则删除该图像文件;
步骤44:计算图像文件的风险区域面积并将该风险区域面积与预存的面积阈值进行比 对,若风险区域面积大于面积阈值则跳转至步骤45;否则跳转至步骤46;
步骤45:对图像文件上的风险区域进行模糊处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海德拓信息技术股份有限公司,未经上海德拓信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110136240.4/2.html,转载请声明来源钻瓜专利网。