[发明专利]一种视频分类方法、存储介质及终端设备在审
申请号: | 201911378131.2 | 申请日: | 2019-12-27 |
公开(公告)号: | CN113051434A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 盛佳琦 | 申请(专利权)人: | 深圳TCL数字技术有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文 |
地址: | 518000 广东省深圳市前海深港合作区前湾一路鲤鱼门街一号前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 分类 方法 存储 介质 终端设备 | ||
本发明公开了一种视频分类方法、分类装置以及终端设备,所述方法包括:获取待分类视频的图像特征以及音频特征;根据获取到图像特征和音频特征生成所述待分类视频对应的视频特征;将所述视频特征输入至预先训练的视频类别模型中,并通过该视频类别模型得到所述待分类视频对应的视频类别。这样根据待分类视频的图像特征以及音频特征来确定待分类视频的视频分类,可以提高视频分类的准确性。
技术领域
本发明涉及视频处理技术领域,特别涉及一种视频分类方法、存储介质及终端设备。
背景技术
真实视频类别概率集是通过分析、理解视频信息,将视频分到事先定义好的类别中去。真实视频类别概率集是计算机视觉中最基本、最重要的任务之一。目前普遍使用真实视频类别概率集主要是通过对用户对上传视频的文字描述(例如,视频的题目,标签和简介等)或者根据观看视频的留言确定关键词信息,确定视频的类型,这样在文字描述获取关键词信息有误时,会使得真实视频类别概率集错误。
发明内容
本发明要解决的技术问题在于,针对现有技术的不足,提供一种视频分类方法、存储介质及终端设备。
为了解决上述技术问题,本发明所采用的技术方案如下:
一种视频分类方法,所述方法包括:
获取待分类视频的图像特征以及音频特征;
根据获取到图像特征和音频特征生成所述待分类视频对应的视频特征;
将所述视频特征输入至预先训练的视频分类模型中,以得到所述待分类视频对应的视频类别,其中,所述视频分类模型为基于所述训练视频特征以及训练视频特征对应的真实视频类别训练得到的。
所述视频分类方法,其中,所述视频分类模型包括若干视频分类单元;所述将所述视频特征输入至预先训练的视频分类模型中,以得到所述待分类视频对应的视频类别具体包括:
将所述视频特征分别输入至若干视频分类单元,通过若干视频分类单元输出若干视频类别概率集;
根据所述若干视频类别概率集,确定所述待分类视频对应的视频类别。
所述视频分类方法,其中,所述若干视频类别概率集中每个视频类别概率集均对应一个视频类别集,并各视频类别概率集对应的视频类别集相同。
所述视频分类方法,其中,所述根据所述若干视频类别概率集,确定所述待分类视频对应的视频类别具体为:
将每个视频类别概率集中对应相同视频类别的视频类别概率进行加权,确定所述待分类视频对应的视频类别。
所述视频分类方法,其中,所述获取待分类视频的图像特征以及音频特征具体包括:
通过预设的图像特征模型提取所述待分类视频对应的图像特征;
通过预设的音频特征模型提取所述待分类视频对应的音频特征。
所述视频分类方法,其中,所述通过预设的图像特征模型提取所述待分类视频对应的图像特征之前包括:
按照预设规则在所述待分类视频中选取若干图像帧,并将选取到的各图像帧转换为单通道图像;
根据转换得到的所有单通道图像生成图像向量,其中,所述图像向量为所述图像特征模型的输入项。
所述视频分类方法,其中,所述图像特征模型的训练过程包括:
基于图像训练样本以及图像训练样本对应的图像标签对应待训练的第一预设网络模型进行训练;
当所述第一预设网络模型训练完成后,确定训练得到的第一预设网络模型中图像特征提取层,并将所述图像特征提取层后的所有网络层去除,以得到所述图像特征模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳TCL数字技术有限公司,未经深圳TCL数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911378131.2/2.html,转载请声明来源钻瓜专利网。