[发明专利]视频特效类型的识别方法、装置、电子设备及存储介质在审
申请号: | 202111282374.3 | 申请日: | 2021-11-01 |
公开(公告)号: | CN114022813A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 曾子琦;黄海斌;刘大昀;马重阳 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 特效 类型 识别 方法 装置 电子设备 存储 介质 | ||
本公开关于一种视频特效类型的识别方法、装置、电子设备及存储介质。所述方法包括:获取目标视频包含的视频图像;将视频图像输入至预先训练的多级分类模型中;其中,多级分类模型中的每一级分类模型对应视频特效的一个分类级别;针对多级分类模型中的每级分类模型,根据每级分类模型的分类结果,在每级分类模型的下一级分类模型中,确定分类结果对应的子分类模型,在存在分类结果对应的子分类模型的情况下,通过子分类模型对视频图像进行识别;将最后一次识别得到的分类结果作为目标视频的视频特效类型。采用本公开可以提高视频特效类型的识别准确度。
技术领域
本公开涉及图像识别技术领域,尤其涉及一种视频特效类型的识别方法、装置、电子设备及存储介质。
背景技术
随着短视频的发展,越来越多的人们在视频中添加视频特效,以美化视频或增加视频的趣味性。视频平台会对视频特效进行识别和分类,以便向用户推荐可能喜欢的视频特效。
相关技术中,通常使用神经网络作为识别模型对视频特效进行识别。具体过程为:先通过标注有视频特效类型的视频样本对神经网络进行训练,得到识别模型,然后将待识别的视频输入至识别模型中,输出该视频所包含的视频特效的类型。
然而,上述方案使用单个神经网络进行识别,由于神经网络的识别准确度有限,会导致视频特效类型的识别准确度较低。
发明内容
本公开提供一种视频特效类型的识别方法、装置、电子设备及存储介质,以至少解决相关技术中视频特效类型的识别准确度较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频特效类型的识别方法,包括:
获取目标视频包含的视频图像;
将所述视频图像输入至预先训练的多级分类模型中;其中,所述多级分类模型中的每一级分类模型对应视频特效的一个分类级别;除第一级分类级别以外的各级分类级别所包含的分类,为所述分类级别的上一分类级别所包含的分类的子分类;
针对所述多级分类模型中的每级分类模型,根据所述每级分类模型的分类结果,在所述每级分类模型的下一级分类模型中,确定所述分类结果对应的子分类模型,在存在所述分类结果对应的子分类模型的情况下,通过所述子分类模型对所述视频图像进行识别;
将最后一次识别得到的分类结果作为所述目标视频的视频特效类型。
在其中一个实施例中,所述方法还包括:
在不存在所述分类结果对应的子分类模型的情况下,将当前分类模型的分类结果作为所述目标视频的视频特效类型。
在其中一个实施例中,所述通过所述子分类模型对所述视频图像进行识别,包括:
将多个所述视频图像分别输入至所述子分类模型的特效特征提取层,得到多个所述视频图像对应的多个特效特征;
通过所述子分类模型的池化层对所述多个特效特征进行融合,得到融合特征;
将所述融合特征输入至所述子分类模型的分类层,得到特效分类向量;所述特效分类向量表示所述目标视频属于所述子分类模型包含的各子分类的置信度;
在存在大于预设的置信度阈值的目标置信度的情况下,将所述目标置信度对应的子分类作为所述子分类模型的分类结果;
在不存在大于所述预设的置信度阈值的目标置信度的情况下,将预设子分类作为所述子分类模型的分类结果。
在其中一个实施例中,所述获取目标视频包含的视频图像,包括:
基于预设的抽帧策略对所述目标视频进行抽帧处理,得到所述目标视频包含的视频图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111282374.3/2.html,转载请声明来源钻瓜专利网。