[发明专利]一种视频分类方法、装置、电子设备及存储介质在审
申请号: | 202110029269.2 | 申请日: | 2021-01-11 |
公开(公告)号: | CN112765403A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 迟至真;李思则;李岩 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/78;G06F16/783;G06F16/732 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 分类 方法 装置 电子设备 存储 介质 | ||
本公开公开了一种视频分类方法、装置、电子设备及存储介质,用于解决对视频标注标签效率较低的问题。该方法包括:确定待分类的视频;提取待分类的视频的图像特征,获得待分类的视频的图像特征信息;提取待分类的视频的音频信号,并对音频信号进行特征提取处理,获得待分类的视频的语音特征信息;对图像特征信息和语音特征信息进行上下文转换增强处理,获得目标信息;对目标信息进行分类处理,获得对应的多个类别信息和与类别信息对应的概率值,并将概率值大于预设阈值的类别信息对应的标签确定为待分类的视频的类别标签。
技术领域
本公开涉及互联网技术领域,尤其涉及一种视频分类方法、装置、电子设备及存储介质。
背景技术
由于科技的不断发展,生活工作节奏越来越快,因而播放时长在几分钟以内的视频受到人们的喜爱和关注。
目前,视频内容越来越丰富,仅仅依靠上传视频内容者在上传时为视频标注的类别标签,可能存在类别分化不够细致的问题,导致不能满足用户的精细化要求。并且,随着视频数量与内容的不断增长,需要人工进行审核标注,然而人工的标注效率与视频内容和数量的增长速度并不匹配,导致视频不能及时且准确的呈现给用户。
可见,相关技术中存在对视频标注标签效率较低的技术问题。
发明内容
本公开提供一种视频分类方法、装置、电子设备及存储介质,用于解决相关技术中存在对视频标注标签效率较低的技术问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频分类方法,所述方法包括:
确定待分类的视频;
提取所述待分类的视频的图像特征,获得所述待分类的视频的图像特征信息;以及提取所述待分类的视频的音频信号,并对所述音频信号进行特征提取处理,获得所述待分类的视频的语音特征信息;
对所述图像特征信息和所述语音特征信息进行上下文转换增强处理,获得目标信息,所述目标信息用于表征所述待分类视频中每个帧图像以及每个帧图像与相邻图像所对应的信息;
对所述目标信息进行分类处理,获得对应的多个类别信息和与所述类别信息对应的概率值,并将所述概率值大于预设阈值的类别信息对应的标签确定为所述待分类的视频的类别标签。
在一种可能的实施方式中,通过训练后的视频分类模型提取所述待分类的视频的图像特征,获得所述待分类的视频的图像特征信息,包括:
将所述待分类的视频均匀划分为固定段数的子视频,并从每个子视频中提取一帧图像,获得待处理帧图像集;
对所述待处理帧图像集中的帧图像进行特征提取处理,获得所述待分类的视频的图像特征信息。
在一种可能的实施方式中,若通过训练后的视频分类模型实现对所述待分类的视频的分类,则所述训练后的视频分类模型通过以下方式训练:
确定待训练的数据集,其中,所述待训练的数据集包括已标注标签的视频;
将所述待训练的数据集中的视频输入待训练的视频分类模型中的预设空域子模型进行训练,获得训练后的空域子模型;
通过所述训练后的空域子模型,提取所述待训练的数据集中的视频的所有图像特征,并将所述所有图像特征输入待训练的视频分类模型中的预设时域子模型进行训练,获得训练后的时域子模型;
将输入所述训练后的时域子模型和所述训练后的空域子模型后所获得的信息,输入待训练的视频分类模型中的预设局部聚集子模型进行训练,获得训练后的视频分类模型。
在一种可能的实施方式中,确定待训练的数据集,包括:
确定可用的实体标签词语集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110029269.2/2.html,转载请声明来源钻瓜专利网。