[发明专利]视频分类模型构建、视频分类的方法、装置、设备及介质有效
申请号: | 201911134005.2 | 申请日: | 2019-11-19 |
公开(公告)号: | CN110929780B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 陈楚城;王瑞琛;王晓利 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 模型 构建 方法 装置 设备 介质 | ||
1.一种视频分类模型构建方法,其特征在于,所述方法包括:
获取训练集数据,所述训练集数据包括多帧视频帧;
将所述训练集数据输入待训练分类模型,所述待训练分类模型包括多个卷积层组和一个输出层组,其中部分卷积层组包括非局部模块,每个卷积层组包括至少一个瓶颈模块,所述瓶颈模块与所述非局部模块位于同一个卷积层组时,将所述瓶颈模块和所述非局部模块间隔设置;
通过所述非局部模块提取所述多帧视频帧的长距离依赖特征,所述长距离依赖特征用于表示所述多帧视频帧所包含的空间位置之间的关联关系;
将所述长距离依赖特征输出到所述输出层组,输出所述多帧视频帧的预测分类结果;
通过预设的预测损失函数对所述待训练分类模型进行训练,直至所述待训练分类模型中的参数收敛,得到视频分类模型;
其中,所述多帧视频帧对应的特征图通过所述瓶颈模块进行深度可分离卷积处理,同时对深度可分离卷积处理后的特征图进行通道翻倍处理,得到第一特征图组;
将所述第一特征图组输入所述非局部模块,所述非局部模块计算每张所述特征图所包含的空间位置之间的对应关系,作为长距离依赖特征,输出包含所述长距离依赖特征的第二特征图组。
2.根据权利要求1所述的视频分类模型构建方法,其特征在于,所述预测损失函数包括:
其中,y=1表示训练样本为正样本,y=0表示训练样本为负样本,y′表示训练样本为正样本时,所述待训练分类模型输出的概率值,取值范围是大于等于0,小于等于1;其中,γ为预设数值。
3.根据权利要求1所述的视频分类模型构建方法,其特征在于,所述获取训练集数据包括:
对待处理视频按照时间位置抽取多帧视频帧;
确定所述多帧视频帧中的每帧视频帧的空间位置;
按照预定的空间尺寸对确定空间位置后的视频帧进行多尺度裁剪;
将经过裁剪处理后的视频帧进行缩放、翻转处理得到所述训练集数据。
4.一种视频分类方法,其特征在于,所述方法包括:
获取待分类的视频;
按照预设时间位置从所述视频中获取多帧视频帧;
将所述多帧视频帧输入至预先训练得到的视频分类模型,输出所述多帧视频帧的至少一个分类标签;所述视频分类模型通过权利要求1-3任一项所述的视频分类模型的训练方法训练得到;
根据所述多帧视频帧的至少一个分类标签标识所述视频的类别。
5.一种视频分类模型构建装置,其特征在于,所述装置包括:
第一获取模块,用于获取训练集数据,所述训练集数据包括多帧视频帧;
输入模块,用于将所述训练集数据输入待训练分类模型,所述待训练分类模型包括多个卷积层组和一个输出层组,其中部分卷积层组包括非局部模块,每个卷积层组包括至少一个瓶颈模块,所述瓶颈模块与所述非局部模块位于同一个卷积层组时,将所述瓶颈模块和所述非局部模块间隔设置;
提取模块,用于通过所述非局部模块提取所述多帧视频帧的长距离依赖特征,通过所述瓶颈模块进行深度可分离卷积处理,同时对深度可分离卷积处理后的特征图进行通道翻倍处理,得到第一特征图组,以及将所述第一特征图组输入所述非局部模块,所述非局部模块计算每张所述特征图所包含的空间位置之间的对应关系,作为长距离依赖特征,输出包含所述长距离依赖特征的第二特征图组;所述长距离依赖特征用于表示所述多帧视频帧所包含的空间位置之间的关联关系;
输出模块,用于将所述长距离依赖特征输出到所述输出层组,输出所述多帧视频帧的预测分类结果;
训练模块,用于通过预设的预测损失函数对所述待训练分类模型进行训练,直至所述待训练分类模型中的参数收敛,得到视频分类模型。
6.根据权利要求5所述的视频分类模型构建装置,其特征在于,所述预测损失函数包括:
其中,y=1表示训练样本为正样本,y=0表示训练样本为负样本,y′表示训练样本为正样本时,所述待训练分类模型输出的概率值,取值范围是大于等于0,小于等于1;其中,γ为预设数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911134005.2/1.html,转载请声明来源钻瓜专利网。