[发明专利]一种视频分类的方法、视频分类模型训练的方法及装置有效
申请号: | 201910511487.2 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110263216B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 姜文浩;李弼;刘威 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06V20/40;G06V10/764 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 分类 方法 模型 训练 装置 | ||
本申请公开了一种视频分类的方法,包括:从待分类视频中获取目标视频帧所对应的L个前瞻视频帧,通过视频分类模型中的跳帧器获取L个前瞻视频帧所对应的计划跳帧向量,计划跳帧向量包括每个前瞻视频帧对应的分值元素,根据计划跳帧向量确定待分类视频所对应的待分类视频帧;根据待分类视频帧,通过视频分类模型中的分类器确定待分类视频的分类结果。本申请还公开一种视频分类模型训练的方法以及相关装置。本申请采用跳帧器可以从待分类视频中选择一部分具有代表性的视频帧作为目标视频,将该目标视频输入至分类器进行识别即可,从而减少了冗余信息的干扰,由此提高分类器的分类效率,提升视频分类的速度。
技术领域
本申请涉及人工智能领域,尤其涉及一种视频分类的方法、视频分类模型训练的方法及装置。
背景技术
随着网络多媒体技术的飞速发展,各式各样的多媒体信息不断涌现。越来越多的用户习惯于在网络上观看视频,为了使用户能够从大量的视频中选择自己想观看的内容,通常会对视频进行分类,因此,视频分类对于实现视频的管理以及兴趣推荐具有十分重要的作用,此外,视频分类的结果在监控、检索以及人机交互等领域被广泛应用。
目前,在视频序列分类的技术中,将视频帧的特征输入到循环神经网络(recurrent neural network,RNN)中,将RNN输出的结果输入到逻辑回归(logisticregression,LR)中得到视频类型。
然而,基于上述视频分类方式,需要将视频中的每一帧信息都输入到RNN中,对于视频识别的任务而言,视频帧之间往往具有很多冗余的信息,因此,这些冗余的信息会导致视频分类的速度降低,不利于提升视频分类的效率。
发明内容
本申请实施例提供了一种视频分类的方法、视频分类模型训练的方法及装置,采用跳帧器可以从待分类视频中选择一部分具有代表性的视频帧作为目标视频,将该目标视频输入至分类器进行识别即可,从而减少了冗余信息的干扰,由此提高分类器的分类效率,提升视频分类的速度。
有鉴于此,本申请一个方面提供一种视频分类的方法,包括:
从所述待分类视频中获取目标视频帧所对应的L个前瞻视频帧,其中,所述待分类视频包括T个视频帧,所述L个前瞻视频帧包括所述目标视频帧,所述T为大于1的整数,所述L为大于或等于1,且小于所述T的整数;
通过视频分类模型中的跳帧器获取所述L个前瞻视频帧所对应的计划跳帧向量,其中,所述计划跳帧向量包括每个前瞻视频帧对应的分值元素,所述分值元素用于表示所述前瞻视频帧的选择情况;
根据所述计划跳帧向量选择所述待分类视频所对应的待分类视频帧,其中,所述待分类视频帧所对应的分值元素为第一分值;
根据所述待分类视频帧,通过所述视频分类模型中的分类器确定所述待分类视频的分类结果。
本申请另一个方面提供一种视频分类模型训练的方法,包括:
获取待训练视频集合,其中,所述待训练视频集合包括至少一个待训练视频;
通过待训练跳帧器获取待训练视频所对应的跳帧预测结果,其中,所述跳帧预测结果表示所述待训练视频中输入至待训练分类器的视频帧;
通过所述待训练分类器获取所述待训练视频所对应的分类预测结果;
根据所述跳帧预测结果以及所述分类预测结果,采用目标损失函数训练得到所述待训练跳帧器的模型参数以及所述待训练分类器模型参数,其中,所述目标损失函数包括第一损失函数以及第二损失函数,所述第一损失函数用于训练所述待训练分类器,所述第二损失函数用于训练所述待训练跳帧器;
根据所述待训练跳帧器的模型参数以及所述待训练分类器模型参数,生成视频分类模型,其中,所述视频分类模型包括跳帧器以及分类器。
本申请另一个方面提供一种视频分类装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910511487.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频情感定位方法及系统
- 下一篇:一种视频片段标签识别方法及装置