[发明专利]视频分类方法、装置、设备和介质在审
申请号: | 202110090987.0 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112650885A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 郑磊波;邓天生;贠挺;于天宝;陈国庆 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/78;G06N3/04;G06N3/08 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 设备 介质 | ||
1.一种利用神经网络模型对视频进行分类的方法,包括:
对目标视频进行抽帧,以得到多个目标视频帧,所述多个目标视频帧包括时间标签;以及
将所述多个目标视频帧输入训练好的神经网络模型,获取所述神经网络模型输出的所述目标视频的预测类别,所述预测类别能够表征所述目标视频是否包括未成年人。
2.如权利要求1所述的方法,还包括:
获取原始视频;以及
将所述原始视频进行切分,以得到至少一个目标视频,其中,所述至少一个目标视频中的每一个目标视频所包括的视频帧的数量位于第一预设范围内。
3.如权利要求1或2所述的方法,还包括:
在对目标视频进行抽帧之后,对所述多个目标视频帧进行预处理。
4.如权利要求1所述的方法,其中,所述神经网络模型选择膨胀三维卷积网络或时序分割网络。
5.如权利要求2所述的方法,其中,所述原始视频为直播视频。
6.如权利要求1所述的方法,其中,所述目标视频的预测类别包括未成年人单独出镜类别、未成年人与成年人同时出镜类别和其他类别。
7.一种用于确定视频是否包括未成年人的神经网络模型的训练方法,包括:
对第一样本视频进行抽帧,以得到多个第一样本视频帧,并标注所述多个第一样本视频帧中的每一个第一样本视频帧的第一真实样本类别和时间标签,其中,所述多个第一样本视频帧的第一真实样本类别相同;
将所述多个第一样本视频帧输入所述神经网络模型,获取所述神经网络模型输出的所述第一样本视频的第一预测样本类别;
基于所述第一真实样本类别和所述第一预测样本类别,计算损失值;以及
基于所述损失值,调整所述神经网络模型的参数。
8.如权利要求7所述的方法,还包括:
获取第一原始视频;
标注所述第一原始视频中的每一个视频帧的真实类别;以及
将所述第一原始视频进行切分,以得到所述第一原始视频的至少一个第一样本视频,其中,每一个第一样本视频所包括的视频帧数量均在第一预设范围内。
9.如权利要求8所述的方法,其中,任意两个不同真实样本类别所对应的第一样本视频的数量的比值位于第二预设范围内。
10.如权利要求7所述的方法,其中,所述神经网络模型为预训练模型。
11.如权利要求7所述的方法,还包括:
获取第二样本视频集合,所述第二样本视频集合包括至少一个第二样本视频;
对所述至少一个第二样本视频中的每一个第二样本视频进行抽帧,以得到该第二样本视频的多个第二样本视频帧;
将所述每一个第二样本视频各自对应的多个第二样本视频帧输入所述神经网络模型,获取所述神经网络模型所确定的所述每一个第二样本视频的第二预测样本类别及其置信度;以及
响应于确定相应的第二预测样本类别的置信度小于等于预设值,标注该第二样本视频的第二真实样本类别。
12.如权利要求11所述的方法,还包括:
响应于确定相应的第二预测样本类别的置信度大于预设值,将该第二样本视频的第二预测样本类别作为该第二样本视频的第二真实样本类别。
13.如权利要求11或12所述的方法,还包括:
使用具有第二真实样本类别的至少一个第二样本视频对所述神经网络模型进行进一步训练。
14.如权利要求7所述的方法,其中,所述神经网络模型选择膨胀三维卷积网络或时序分割网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110090987.0/1.html,转载请声明来源钻瓜专利网。