[发明专利]视频文本跨模态检索方法、装置、存储介质和设备在审

专利信息
申请号: 202111095182.1 申请日: 2021-09-17
公开(公告)号: CN113806482A 公开(公告)日: 2021-12-17
发明(设计)人: 陈婧;冯泽润;王海莺;高旭巍;郭彩丽;李忠;张宇峰;李金岭;杜忠田;王彦君;姜祖运 申请(专利权)人: 中国电信集团系统集成有限责任公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F16/75;G06F16/783;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京知汇林知识产权代理事务所(普通合伙) 11794 代理人: 董涛
地址: 100036 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 文本 跨模态 检索 方法 装置 存储 介质 设备
【说明书】:

发明实施例提供视频文本跨模态检索的方法、存储介质和电子装置,所述方法包括:获取训练样本集,其包括成对标注的视频和文本,对视频进行分帧处理并提取帧特征,对文本进行分词处理并提取词特征,所述词特征包括至少两类词性特征,利用帧特征和至少两种词性特征对预训练的跨模态检索模型进行训练,获得训练好的跨模态检索模型,将待测视频和文本输入训练好的跨模态检索模型中进行视频和文本的跨模态检索。本发明细化了视频文本跨模态特征匹配粒度,增强了视频文本跨模态特征匹配过程的可解释性,提高了视频文本跨模态检索的准确率。

技术领域

本发明涉及机器学习技术领域,尤其涉及一种视频文本跨模态检索方法、装置、存储介质和设备。

背景技术

随着移动设备的智能化、便携化以及在线视频平台的蓬勃发展,大量的互联网用户选择通过视频媒介进行信息的共享和传播。在这一趋势下,当前广泛使用的基于文本标题的视频检索方式存在人工标注成本高昂且效率低下,同时文本标题无法对视频中的语义内容全面涵盖等问题,难以有效满足日益增长的海量视频数据管理和分析需求。

视频文本跨模态检索旨在通过语义内容的表征相似性完成实现。具体而言,该检索范式允许查询输入和候选对象为视频和文本其中一种模态数据,将视频和文本进行向量化表示后,计算跨模态向量相似度并排序实现对另一模态数据的检索。由于视频文本跨模态检索是在视频内容理解的基础上实现的语义内容检索,极大的解放了繁重的人工标注劳动,有效的提高了海量视频的智能处理能力。同时该检索方式拓宽了查询输入的模态限制,解决了基于文本标题的视频检索方式中只能使用文本作为查询输入的局限性,满足了用户个性化的检索需求。

现有的关于视频文本跨模态检索的方法主要分为两类。第一类方法将视频和文本均表示为单一特征向量,通过直接计算单一特征向量间的余弦相似度完成检索。然而此类方法将视频和文本表示为紧致的固定维度向量,难以进行关于语义的细粒度特征匹配,降低了检索准确率。第二类方法将视频和文本表示为序列化的帧特征和词特征,通过注意力机制对序列化的帧特征间的余弦相似度加权得到最终结果。但是此类方法忽略了视频和文本关于语义内容在空间和时间维度上的表征方式差异,无法构建与之适应的特征匹配策略,成为了提高检索准确率的瓶颈。

发明内容

本发明提供的视频文本跨模态检索方法、装置、存储介质和设备,通过挖掘视频和文本关于语义内容表征方式的差异性,提高的了视频文本跨模态检索过程中的细粒度、强可解释性和高准确率。

第一方面,本发明实施例提供一种视频文本跨模态检索方法,所述方法包括:

获取训练样本集,所述训练样本集包括成对标注的视频和文本;

对所述视频进行分帧处理,并提取帧特征;

对所述文本进行分词处理并提取词特征,所述词特征包括至少两类词性特征;

利用所述帧特征和至少两种词性特征对预训练的跨模态检索模型进行训练,获得训练好的跨模态检索模型;

将待测视频和文本输入所述训练好的跨模态检索模型中进行视频和文本的跨模态检索。

进一步地,对所述视频进行分帧处理并提取帧特征包括:

利用分帧工具依次对每一段视频进行分帧处理,获得帧序列,将所述帧序列均匀划分为时长相等的预设段,提取每段的第一帧,获得预设帧;

运用卷积神经网络ResNet提取所述预设帧的帧特征。

进一步地,对所述文本进行分词处理并提取词特征,所述词特征包括至少两种词性特征包括:

利用分词工具依次对每一条文本进行分词;

利用Simple-bert语义角色标注工具对每个词的词性进行分类;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信集团系统集成有限责任公司,未经中国电信集团系统集成有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111095182.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top