[发明专利]视频分类的方法、装置及存储介质在审
申请号: | 202111490732.X | 申请日: | 2021-12-08 |
公开(公告)号: | CN114238690A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 黄剑辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06F40/258;G06F40/30;G06K9/62;G06V10/774;G06V10/80 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 存储 介质 | ||
本申请提供一种视频分类的方法、装置、及存储介质,涉及计算机技术领域,可应用于云技术、人工智能、智慧交通等各种场景;包括:获取待分类视频包含的至少两个视频帧图像,以及待分类视频对应的文本信息;分别确定至少两个视频帧图像各自对应的图像特征信息,以及文本信息对应的文本特征信息;将确定的各个图像特征信息,分别与文本特征信息进行融合处理,获得相应的融合特征信息,并将各个融合特征信息进行映射操作,确定目标特征信息;基于目标特征信息,确定待分类视频对应的视频标签。将多个视频帧图像和文本信息进行交互融合,增强图文交互的维度信息,避免信息丢失,提升内容的丰富度,保证视频分类的准确性。
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频分类的方法、装置及存储介质。
背景技术
随着科技的发展,各种视频平台越来越流行,且各视频平台中包含的视频数量越来越多。
为了更好的进行视频推荐、搜索、分发等业务的发展,目前,已提出了视频分类技术,视频分类技术即确定视频标签,其中,视频标签不仅可以准确地刻画视频的特征,还可以辅助刻画目标对象的兴趣和习惯,更能够为视频推荐、搜索、分发等业务提供全面准确的依据。
目前,在进行视频分类时,主要基于视频的标题信息进行视频分类。但由于标题信息中涵盖的视频内容少,因此,基于标题信息无法准确的确定视频标签,导致视频分类的准确性低,进而影响视频推荐、搜索、分发的效率。
发明内容
本申请提供一种视频分类的方法、装置及存储介质,用以提升视频分类的准确性。
第一方面,本申请实施例提供一种视频分类的方法,该方法包括:
获取待分类视频包含的至少两个视频帧图像,以及待分类视频对应的文本信息;
分别确定至少两个视频帧图像各自对应的图像特征信息,以及文本信息对应的文本特征信息;
将确定的各个图像特征信息,分别与文本特征信息进行融合处理,获得相应的融合特征信息,并将各个融合特征信息进行映射操作,确定目标特征信息;
基于目标特征信息,确定待分类视频对应的视频标签。
第二方面,本申请实施例提供一种视频分类的装置,该装置包括:
获取单元,用于获取待分类视频包含的至少两个视频帧图像,以及待分类视频对应的文本信息;
第一确定单元,用于分别确定至少两个视频帧图像各自对应的图像特征信息,以及文本信息对应的文本特征信息;
融合单元,用于将确定的各个图像特征信息,分别与文本特征信息进行融合处理,获得相应的融合特征信息,并将各个融合特征信息进行映射操作,确定目标特征信息;
第二确定单元,用于基于目标特征信息,确定待分类视频对应的视频标签。
在一种可能的实现方式中,获取单元,具有用于:
对待分类视频进行划分处理,获得多个子视频;
在多个子视频中,基于各个子视频对应的重要度,筛选出符合重要度条件的至少两个目标子视频;其中,重要度是:基于相应的子视频中,包含的各个视频帧图像属于关键信息的目标概率值确定的;
分别在至少两个目标子视频中,基于目标概率值,选取至少一个视频帧图像。
在一种可能的实现方式中,获取单元,具有用于执行以下操作中的至少一种:
获取待分类视频的标题信息,将标题信息作为文本信息;
获取待分类视频的视频帧图像中包含的文字内容,将文字内容作为文本信息;
获取待分类视频的音频信息,将音频信息转换为文本信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111490732.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电池正极材料拌料装置及方法
- 下一篇:一种设备流量调整操作的方法及装置