[发明专利]一种视频分类方法、存储介质及终端设备在审
申请号: | 201911378131.2 | 申请日: | 2019-12-27 |
公开(公告)号: | CN113051434A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 盛佳琦 | 申请(专利权)人: | 深圳TCL数字技术有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文 |
地址: | 518000 广东省深圳市前海深港合作区前湾一路鲤鱼门街一号前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 分类 方法 存储 介质 终端设备 | ||
1.一种视频分类方法,其特征在于,所述方法包括:
获取待分类视频的图像特征以及音频特征;
根据获取到图像特征和音频特征生成所述待分类视频对应的视频特征;
将所述视频特征输入至预先训练的视频分类模型中,以得到所述待分类视频对应的视频类别,其中,所述视频分类模型为基于所述训练视频特征以及训练视频特征对应的真实视频类别训练得到的。
2.根据权利要求1所述视频分类方法,其特征在于,所述视频分类模型包括若干视频分类单元;所述将所述视频特征输入至预先训练的视频分类模型中,以得到所述待分类视频对应的视频类别具体包括:
将所述视频特征分别输入至若干视频分类单元,通过若干视频分类单元输出若干视频类别概率集;
根据所述若干视频类别概率集,确定所述待分类视频对应的视频类别。
3.根据权利要求2所述视频分类方法,其特征在于,所述若干视频类别概率集中每个视频类别概率集均对应一个视频类别集,并各视频类别概率集对应的视频类别集相同。
4.根据权利要求3所述视频分类方法,其特征在于,所述根据所述若干视频类别概率集,确定所述待分类视频对应的视频类别具体为:
将每个视频类别概率集中对应相同视频类别的视频类别概率进行加权,确定所述待分类视频对应的视频类别。
5.根据权利要求1-4任一所述视频分类方法,其特征在于,所述获取待分类视频的图像特征以及音频特征具体包括:
通过预设的图像特征模型提取所述待分类视频对应的图像特征;
通过预设的音频特征模型提取所述待分类视频对应的音频特征。
6.根据权利要求5所述视频分类方法,其特征在于,所述通过预设的图像特征模型提取所述待分类视频对应的图像特征之前包括:
按照预设规则在所述待分类视频中选取若干图像帧,并将选取到的各图像帧转换为单通道图像;
根据转换得到的所有单通道图像生成图像向量,其中,所述图像向量为所述图像特征模型的输入项。
7.根据权利要求6所述视频分类方法,其特征在于,所述图像特征模型的训练过程包括:
基于图像训练样本以及图像训练样本对应的图像标签对应待训练的第一预设网络模型进行训练;
当所述第一预设网络模型训练完成后,确定训练得到的第一预设网络模型中图像特征提取层,并将所述图像特征提取层后的所有网络层去除,以得到所述图像特征模型。
8.根据权利要求6所述视频分类方法,其特征在于,所述通过预设的音频特征模型提取所述待分类视频对应的音频特征之前包括:
获取所述待分类视频对应的音频文件,并对所述音频文件进行处理以得到所述音频文件对应的音频向量,其中,所述音频向量为所述音频特征模型的输入项。
9.根据权利要求6所述视频分类方法,其特征在于,所述音频特征模型的训练过程具体包括:
基于音频训练样本以及音频训练样本对应的音频标签对第二预设网络模型进行训练;
当所述第二预设网络模型训练完成后,确定训练得到的第二预设网络模型中音频特征提取层,并将所述音频特征提取层后的所有网络层去除,以得到所述音频特征模型。
10.根据权利要求1-4任一所述视频分类方法,其特征在于,所述图像特征为图像特征向量,所述音频特征为音频特征向量;所述根据获取到图像特征和音频特征生成所述待分类视频对应的视频特征具体为:
将所述图像特征向量与所述音频特征向量进行拼接,以生成所述视频特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL数字技术有限公司,未经深圳TCL数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911378131.2/1.html,转载请声明来源钻瓜专利网。