[发明专利]一种标签提取方法及装置有效
申请号: | 202010329789.0 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111222500B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 刘树林 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 提取 方法 装置 | ||
本申请涉及计算机技术领域,并涉及人工智能的计算机视觉、机器学习等技术,尤其涉及一种标签提取方法及装置,获取待提取视频和所述待提取视频的视频标题;提取所述视频标题的标题特征信息;提取所述待提取视频中的各个目标视频帧的图像特征信息,并分别对所述各个目标视频帧,根据目标视频帧的图像特征信息和所述标题特征信息进行目标检测,获得所述各个目标视频帧的标签;根据所述各个目标视频帧的标签,确定所述待提取视频的标签,这样,融合标题特征信息和图像特征信息进行标签提取,可以提高视频标签提取的准确性。
技术领域
本申请涉及计算机技术领域,尤其涉及一种标签提取方法及装置。
背景技术
视频标签提取是指识别视频中描述的主要物体和内容,视频标签可应用于视频的分类、推荐及检索等任务中,相关技术中视频标签提取方法通常仅是依据单一信息来提取视频标签,但是单独使用一种信息受到影响较大,准确性较低,容易导致提取的标签错误。
发明内容
本申请实施例提供一种标签提取方法及装置,以提高视频标签提取的准确性。
本申请实施例提供的具体技术方案如下:
本申请一个实施例提供了一种标签提取方法,包括:
获取待提取视频和所述待提取视频的视频标题;
提取所述视频标题的标题特征信息;
提取所述待提取视频中的各个目标视频帧的图像特征信息,并分别对所述各个目标视频帧,根据目标视频帧的图像特征信息和所述标题特征信息进行目标检测,获得所述各个目标视频帧的标签;
根据所述各个目标视频帧的标签,确定所述待提取视频的标签。
本申请另一个实施例提供了一种标签提取装置,包括:
获取模块,用于获取待提取视频和所述待提取视频的视频标题;
提取模块,用于提取所述视频标题的标题特征信息;
处理模块,用于提取所述待提取视频中的各个目标视频帧的图像特征信息,并分别对所述各个目标视频帧,根据目标视频帧的图像特征信息和所述标题特征信息进行目标检测,获得所述各个目标视频帧的标签;
确定模块,用于根据所述各个目标视频帧的标签,确定所述待提取视频的标签。
可选的,提取所述视频标题的标题特征信息时,提取模块具体用于:
基于已训练的文本编码模型,以所述视频标题为输入,依次通过所述文本编码模型的卷积层和池化层,对所述视频标题进行卷积和压缩操作,获得所述视频标题的标题特征信息。
可选的,提取所述待提取视频中的各个目标视频帧的图像特征信息,并分别对所述各个目标视频帧,根据目标视频帧的图像特征信息和所述标题特征信息进行目标检测,获得所述各个目标视频帧的标签时,处理模块具体用于:
基于已训练的目标检测模型,提取所述待提取视频中的各个目标视频帧的图像特征信息,并分别对所述各个目标视频帧,根据目标视频帧的图像特征信息和所述标题特征信息进行目标检测,获得所述各个目标视频帧的标签,所述目标检测模型包括图像特征提取模块和目标检测模块,其中:
所述图像特征提取模块分别以所述各个目标视频帧为输入,对所述各个目标视频帧进行卷积操作,获得所述各个目标视频帧的图像特征信息;
所述目标检测模块以所述标题特征信息和所述各个目标视频帧的图像特征信息为输入,分别对所述各个目标视频帧进行目标检测,获得所述各个目标视频帧中检测到的目标所属的类别和类别置信度;并分别将所述各个目标视频帧中检测到的目标所属的类别,作为对应目标视频帧的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010329789.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高速铁路路基结构设计方法
- 下一篇:孔类零件的测量系统