[发明专利]视频标签的确定方法和装置、存储介质及电子设备在审
申请号: | 202110443120.9 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113761278A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 袁宇辰;郑茂 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 标签 确定 方法 装置 存储 介质 电子设备 | ||
本发明公开了一种视频标签的确定方法和装置、存储介质及电子设备。其中,该方法包括:在视频标签确定的过程中,在视频级特征的基础上,融合图片级特征得到融合特征,以确定视频的视频标签,从而实现即使从视频中抽取的视频帧中只有少量视频帧包含目标对象,也能结合图片级特征准确地定位到目标对象(而非其他内容)上,使得确定出的视频标签更准确,进而解决了现有技术中,确定的视频标签准确性较低的技术问题。
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种视频标签的确定方法和装置、存储介质及电子设备。
背景技术
随着网络技术的快速发展,多媒体的推广应用,各种视频源源不断地产生,视频等媒体数据已经成为大数据的主体,视频标签是视频内容的一种高度概括,是视频管理的重要依据。在视频推荐系统中,视频标签可用于计算视频相似度,进而基于用户喜好向用户推荐相似视频。针对大量视频如何自动生成相关的标签,将对满足用户的信息获取需求有重大意义。
现有技术方案大多聚焦于单独的视频多标签分类模型,如从视频中抽取部分关键帧图像,利用训练好的分类模型对每个关键帧图像进行分类得到每个关键帧图像的标签,根据关键帧对应的标签得到视频的标签。在视频背景变化复杂、或帧与帧之间跳动剧烈时,容易学到不正确的特征。以汽车标签识别为例,有些车型评测视频会经常在人物解说与车辆展示之间变化。当人物解说占据大多数时长时,所抽取的帧可能只有少数包含车辆,而大多数拍摄的都是人物。此时,单独的视频分类模型容易受到数据平衡性影响,会在占据大多数时长的人物镜头上学习车型的特征,导致模型学到错误的特征,从而使得视频分类模型输出的视频标签不准确。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种视频标签的确定方法和装置、存储介质及电子设备,以至少解决现有技术中,确定的视频标签准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种视频标签的确定方法,包括:从目标视频中抽取一组视频帧;获取所述一组视频帧中的每个视频帧的视频级特征,得到一组视频级特征;获取所述一组视频帧中的每个视频帧的图片级特征,得到一组图片级特征;将所述一组视频级特征和所述一组图片级特征进行特征融合,得到第一组融合特征;根据所述第一组融合特征,确定所述目标视频的视频标签。
根据本发明实施例的另一方面,还提供了一种视频标签的确定装置,包括:视频帧抽取单元,用于从目标视频中抽取一组视频帧;第一获取单元,用于获取所述一组视频帧中的每个视频帧的视频级特征,得到一组视频级特征;第二获取单元,用于获取所述一组视频帧中的每个视频帧的图片级特征,得到一组图片级特征;融合单元,将所述一组视频级特征和所述一组图片级特征进行特征融合,得到第一组融合特征;确定单元,用于根据所述第一组融合特征,确定所述目标视频的视频标签。
可选的,所述第三获取单元,包括:检测模块,用于对每个视频帧进行目标检测,得到每个视频帧的目标检测结果;第一获取模块,用于根据每个视频帧的目标检测结果,获取每个视频帧的目标局部图片;提取模块,用于对每个视频帧的目标局部图片进行特征提取,得到每个视频帧的图片级特征。
可选的,所述提取模块,用于执行如下操作:对每个视频帧执行以下操作,其中,在执行以下操作时,每个视频帧为当前视频帧:对当前视频帧进行目标检测,得到当前视频帧的目标检测结果,其中,在当前视频帧中检测到一组目标的情况下,当前视频帧的目标检测结果包括当前视频帧中一组目标所在的检测框,一组目标包括1个或至少2个目标。
可选的,所述检测模块,包括:预处理子模块,用于将当前视频帧进行预处理,得到第一预处理图片,其中,第一预处理图片的图片尺寸为第一预设尺寸;检测子模块,用于将第一预处理图片输入到目标检测模型,得到目标检测模型输出的当前视频帧的目标检测结果,其中,目标检测模型用于在第一预处理图片中检测预设类型的目标,预设类型包括1个或至少2个类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110443120.9/2.html,转载请声明来源钻瓜专利网。