[发明专利]模型训练、视频分类方法,装置,设备以及存储介质在审
申请号: | 202110924849.8 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113627536A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 吴文灏;夏博洋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 视频 分类 方法 装置 设备 以及 存储 介质 | ||
1.一种模型训练方法,包括:
利用预先训练的视频分类模型,确定样本视频中各视频帧的视频分类结果;
根据各视频帧的视频分类结果以及所述样本视频中各视频帧的标注分类结果,确定所述样本视频中的显著帧;
基于所述显著帧,训练显著帧确定模型。
2.根据权利要求1所述的方法,其中,所述根据各视频帧的视频分类结果以及所述样本视频中各视频帧的标注分类结果,确定所述样本视频中的显著帧,包括:
对于每个视频帧,响应于确定该视频帧的视频分类结果与该视频帧的标注分类结果一致,确定该视频帧为显著帧。
3.根据权利要求1所述的方法,其中,所述基于所述显著帧,训练显著帧确定模型,包括:
基于所述显著帧以及所述显著帧的标注分类结果,确定目标损失函数;
根据所述目标损失函数,训练显著帧确定模型。
4.根据权利要求3所述的方法,其中,所述基于所述显著帧以及所述显著帧的标注分类结果,确定目标损失函数,包括:
根据所述显著帧,更新所述样本视频中各视频帧的标注分类标识;
将所述样本视频中的各视频帧输入所述显著帧确定模型,根据所述显著帧确定模型的输出确定各视频帧的预测分类标识;
根据所述预测分类标识以及更新的标注分类标识,确定目标损失函数。
5.根据权利要求4所述的方法,其中,根据所述显著帧,更新所述样本视频中各视频帧的标注分类标识,包括:
将所述样本视频中非显著帧的标注分类标识设置为预设数值;
响应于确定所述预设数值与更新前的标注分类标识重复,更新部分或全部显著帧的标注分类标识,以避免重复。
6.根据权利要求3所述的方法,其中,所述基于所述显著帧以及所述显著帧的标注分类结果,确定目标损失函数,包括:
根据所述样本视频中的各视频帧,确定混叠帧;
根据得到所述混叠帧的视频帧的标注分类结果,确定与所述混叠帧对应的混叠分类结果;
根据所述显著帧、所述显著帧的标注分类结果、所述混叠帧以及所述混叠帧对应的混叠分类结果,确定目标损失函数。
7.根据权利要求6所述的方法,其中,所述根据所述样本视频中的各视频帧,确定混叠帧,包括:
对于所述样本视频中的每个视频帧,从样本视频中选取一个视频帧与该视频帧进行混叠,得到混叠帧。
8.根据权利要求6所述的方法,其中,所述根据得到所述混叠帧的视频帧的标注分类结果,确定与所述混叠帧对应的混叠分类结果,包括:
更新各视频帧的标注分类结果对应的标注分类标识;
根据得到所述混叠帧的视频帧的更新的标注分类标识,确定所述混叠帧对应的混叠分类结果。
9.根据权利要求6所述的方法,其中,所述根据所述显著帧、所述显著帧的标注分类结果、所述混叠帧以及所述混叠帧对应的混叠分类结果,确定目标损失函数,包括:
根据所述显著帧以及所述显著帧的标注分类结果,确定第一损失函数;
根据所述混叠帧以及所述混叠帧对应的混叠分类结果,确定第二损失函数;
根据所述第一损失函数以及所述第二损失函数,确定目标损失函数。
10.一种视频分类方法,包括:
获取目标视频;
利用通过权利要求1-9任一项所述的模型训练方法训练得到的显著帧确定模型确定所述目标视频的显著帧;
根据所述目标视频的显著帧以及预先训练的视频分类模型,确定所述目标视频的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110924849.8/1.html,转载请声明来源钻瓜专利网。