[发明专利]视频分类模型的训练方法、装置、设备及存储介质有效
申请号: | 202010286261.X | 申请日: | 2020-04-13 |
公开(公告)号: | CN111401474B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 尹康;吴宇斌;郭烽 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06F16/75;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢惠童 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种视频分类模型的训练方法,其特征在于,所述方法包括:
获取无标签视频集合,所述无标签视频集合中包括至少一个无标签视频,所述无标签视频是指未经人工标注的视频;
根据所述无标签视频集合生成自监督标签视频集合,所述自监督标签视频集合包括至少一个自监督标签视频,所述自监督标签视频对应有各自的标准标签向量;
将所述自监督标签视频输入神经网络模型中,得到所述自监督标签视频对应的预测标签向量;
根据指数归一化处理后的所述预测标签向量和所述自监督标签视频对应的所述标准标签向量,确定所述神经网络模型的第一交叉熵损失函数的值;
根据所述第一交叉熵损失函数的值,训练所述神经网络模型,得到完成训练的所述神经网络模型,所述神经网络模型包括特征提取模块;
将完成训练的所述特征提取模块与随机初始化的视频分类模块级联,生成视频分类模型;
获取标签视频集合,所述标签视频集合中包括至少一个标签视频,所述标签视频是指经人工标注的视频;
通过所述标签视频集合对所述视频分类模型进行训练,得到完成训练的所述视频分类模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述无标签视频集合生成自监督标签视频集合,包括:
对于所述无标签视频集合中的每一个所述无标签视频,在所述无标签视频中随机截取n个视频片段,所述n为正整数;
对所述n个视频片段按照时间顺序依次编号;
随机打乱所述n个视频片段的顺序;
根据不同顺序的所述n个视频片段各自形成的自监督标签视频,生成所述自监督标签视频集合。
3.根据权利要求2所述的方法,其特征在于,所述在所述无标签视频中随机截取n个视频片段,包括:
从所述无标签视频的第一帧至目标帧之间随机选择一帧作为起始帧;
从所述起始帧开始每隔预设帧数截取等长的图像帧,得到所述n个视频片段。
4.根据权利要求1所述的方法,其特征在于,所述通过所述标签视频集合对所述视频分类模型进行训练,得到完成训练的所述视频分类模型,包括:
将所述标签视频输入所述视频分类模型中,得到所述标签视频对应的预测分类向量;
根据归一化处理后的所述预测分类向量和所述标签视频对应的标准分类向量,确定所述视频分类模型的第二交叉熵损失函数的值;
根据所述第二交叉熵损失函数的值,训练所述视频分类模型,得到完成训练的所述视频分类模型。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
获取待分类视频;
将所述待分类视频输入完成训练的所述视频分类模型中,得到所述待分类视频对应的分类向量;
响应于所述分类向量包括的目标向量的值大于阈值,确定所述待分类视频属于所述目标向量对应的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010286261.X/1.html,转载请声明来源钻瓜专利网。