[发明专利]视频分类方法、装置及电子设备有效
申请号: | 201911059325.6 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110766096B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 李果;陈熊;汪贤;樊鸿飞;蔡媛 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/80;G06V10/82;G06V20/40 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 徐彦圣 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 电子设备 | ||
本发明提供了一种视频分类方法、装置及电子设备,该方法包括:获取待分类视频;根据待分类视频中的多个目标图像帧,确定待分类视频对应的目标图像集,其中,目标图像集中包括多个目标图像帧;将目标图像集输入至目标分类模型,并获得目标分类模型输出的目标图像集对应的目标视频场景,其中,目标分类模型用于获取目标图像集中每个目标图像帧对应的图像特征,并根据每个目标图像帧对应的图像特征确定目标视频场景;根据目标图像集对应的目标视频场景,确定待分类视频的分类结果,其中,分类结果用于指示待分类视频的视频场景。本发明可以有效提高视频分类结果的准确度。
技术领域
本发明涉及深度学习技术领域,尤其是涉及一种视频分类方法、装置及电子设备。
背景技术
近年来,随着各类视频APP(Application,应用程序)的发展,互联网中的视频数量也迅速增长,且内容丰富多样,通过对视频进行分类不仅便于用户查找所需视频,还有助于提取视频中所传达的信息。目前对视频进行分类时,需要对视频中抽取的图像帧所属的类别进行确认,再计算抽取的图像帧的分类结果的平均值,以得到最终的视频分类结果。发明人经研究发现,通过求取图像帧分类结果的平均值以确定视频分类结果的方法,准确度并不高。
发明内容
有鉴于此,本发明的目的在于提供一种视频分类方法、装置及电子设备,可以有效提高视频分类结果的准确度。
第一方面,本发明实施例提供了一种视频分类方法,包括:获取待分类视频;根据所述待分类视频中的多个目标图像帧,确定所述待分类视频对应的目标图像集,其中,所述目标图像集中包括所述多个目标图像帧;将所述目标图像集输入至目标分类模型,并获得所述目标分类模型输出的所述目标图像集对应的目标视频场景,其中,所述目标分类模型用于获取所述目标图像集中每个目标图像帧对应的图像特征,并根据所述每个目标图像帧对应的图像特征确定所述目标视频场景;根据所述目标图像集对应的所述目标视频场景,确定所述待分类视频的分类结果,其中,所述分类结果用于指示所述待分类视频的视频场景。
在一种实施方式中,所述图像特征包括浅层特征、深层特征、空间特征和时序特征中的一种或多种;所述目标分类模型包括特征融合网络,以及与所述特征融合网络连接的特征提取网络;其中,所述将所述目标图像集输入至目标分类模型,并获得所述目标分类模型输出的所述目标图像集对应的目标视频场景的步骤,包括:将所述目标图像集输入至目标分类模型的特征融合网络,通过所述特征提取网络提取所述目标图像集中每个目标图像帧的浅层特征;将所述浅层特征输入至所述目标分类模型的特征融合网络,通过所述特征融合网络基于所述浅层特征提取所述目标图像集中每个目标图像帧的深层特征、空间特征和时序特征,并基于所述深层特征、所述空间特征和所述时序特征输出所述目标图像集对应的目标视频场景;所述深层特征的特征层次高于所述浅层特征的特征层次。
在一种实施方式中,在所述将所述目标图像集输入至目标分类模型的特征融合网络,通过所述特征提取网络提取所述目标图像集中每个目标图像帧的浅层特征的步骤之前,所述方法还包括:获取预训练模型,将所述预训练模型的网络参数设置为所述特征提取网络的初始参数;通过反向传播对设置初始参数后的特征提取网络的指定层进行训练,并将训练后的特征提取网络作为所述目标分类模型中的特征提取网络。
在一种实施方式中,所述特征提取网络包括依次连接的多个特征提取子网络;所述将所述目标图像集输入至目标分类模型的特征融合网络,通过所述特征提取网络提取所述目标图像集中每个目标图像帧的浅层特征的步骤,包括:将所述目标图像集输入至目标分类模型的特征融合网络中第一个特征提取子网络,通过所述第一个特征提取子网络对所述目标图像集中每个目标图像帧进行特征提取;按照所述特征提取子网络的连接顺序,将所述第一个特征提取子网络提取的特征输入至下一特征提取子网络,通过所述下一特征提取子网络对所述第一个特征提取子网络提取的特征进行特征提取,直至得到所述目标图像集中每个目标图像帧的浅层特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911059325.6/2.html,转载请声明来源钻瓜专利网。