[发明专利]视频分类模型的训练方法、装置、设备及存储介质有效
申请号: | 202010286261.X | 申请日: | 2020-04-13 |
公开(公告)号: | CN111401474B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 尹康;吴宇斌;郭烽 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06F16/75;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢惠童 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 模型 训练 方法 装置 设备 存储 介质 | ||
本申请实施例提供了一种视频分类模型的训练方法、装置、设备及存储介质,涉及视频分类技术领域。所述方法包括:获取无标签视频集合,无标签视频集合中包括至少一个无标签视频,无标签视频是指未经人工标注的视频;根据无标签视频集合对神经网络模型进行训练,得到完成训练的神经网络模型,神经网络模型包括特征提取模块;将完成训练的特征提取模块与随机初始化的视频分类模块级联,生成视频分类模型;获取标签视频集合,标签视频集合中包括至少一个标签视频,标签视频是指经人工标注的视频;通过标签视频集合对视频分类模型进行训练,得到完成训练的视频分类模型。本申请实施例可以提高视频分类模型的训练效率。
技术领域
本申请实施例涉及视频分类技术领域,特别涉及一种视频分类模型的训练方法、装置、设备及存储介质。
背景技术
视频分类的目的在于对输入视频打上一个或多个包含主体、场景、行为等信息的标签,如:人、操场、跑步等。
在相关技术中,可以通过视频分类模型完成对视频的分类,视频分类模型进行应用之前需要先进行训练,一般通过带有标签的视频对视频分类模型进行训练,视频分类模型需要超大规模的带有标签的视频才能使得训练得到的视频分类模型的精度较高。
由于视频分类模型的预测精度依赖于视频的标签的准确度,虽然人工标注能提升标签的准确度,但人工标注的效率低,从而导致视频分类模型的训练效率也较低。
发明内容
本申请实施例提供一种视频分类模型的训练方法、装置、设备及存储介质。
所述技术方案如下:
一方面,本申请实施例提供一种视频分类模型的训练方法,所述方法包括:
获取无标签视频集合,所述无标签视频集合中包括至少一个无标签视频,所述无标签视频是指未经人工标注的视频;
根据所述无标签视频集合对神经网络模型进行训练,得到完成训练的所述神经网络模型,所述神经网络模型包括特征提取模块;
将完成训练的所述特征提取模块与随机初始化的视频分类模块级联,生成视频分类模型;
获取标签视频集合,所述标签视频集合中包括至少一个标签视频,所述标签视频是指经人工标注的视频;
通过所述标签视频集合对所述视频分类模型进行训练,得到完成训练的所述视频分类模型。
另一方面,本申请实施例提供一种视频分类模型的训练装置,所述装置包括:
集合获取模块,用于获取无标签视频集合,所述无标签视频集合中包括至少一个无标签视频,所述无标签视频是指未经人工标注的视频;
模型训练模块,用于根据所述无标签视频集合对神经网络模型进行训练,得到完成训练的所述神经网络模型,所述神经网络模型包括特征提取模块;
模型生成模块,用于将完成训练的所述特征提取模块与随机初始化的视频分类模块级联,生成视频分类模型;
所述集合获取模块,还用于获取标签视频集合,所述标签视频集合中包括至少一个标签视频,所述标签视频是指经人工标注的视频;
所述模型训练模块,还用于通过所述标签视频集合对所述视频分类模型进行训练,得到完成训练的所述视频分类模型。
另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上述方面所述的视频分类模型的训练方法。
又一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上述方面所述的视频分类模型的训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010286261.X/2.html,转载请声明来源钻瓜专利网。