[发明专利]一种基于图卷积神经网络的跨模态检索方法有效

专利信息
申请号: 202010254505.6 申请日: 2020-04-02
公开(公告)号: CN111598214B 公开(公告)日: 2023-04-18
发明(设计)人: 白琮;周鹏飞 申请(专利权)人: 浙江工业大学
主分类号: G06N3/0464 分类号: G06N3/0464;G06N3/08;G06F18/214;G06F18/25;G06F16/45;G06F16/43;G06F16/48
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图卷 神经网络 跨模态 检索 方法
【说明书】:

一种基于图卷积神经网络的跨模态检索方法,包括网络构建、数据集预处理、网络训练和检索与精度测试四个过程。利用图卷积神经网络分别学习图像模态和文本模态中的语义表征,可以帮助处理各模态特征之间的潜在联系,其将第三模态的关联数据引入跨模态检索方法中,以缩小模态间的语义鸿沟,可以显著提高跨模态检索的精确度与稳定性,从而实现准确的跨模态检索。

技术领域

发明涉及多模态检索领域,特别涉及一种端到端的跨模态检索方法。

背景技术

跨模态检索是一种使用一种模态的数据进行查询并返回其他不同模态下检索结果的方法,广泛应用于图像和文本数据的匹配。例如,在传统的图像到文本的跨模态检索任务中,通过检索将最相似的文本作为输出。近年来,随着深度学习的快速发展,目前的跨模态检索方法大多通过神经网络使用多模态数据直接检索,而不依赖于标签,但其方法简单地将跨模态检索算法与深度神经网络相结合,如选择图像中的几个特征进行降维操作等,大多没有充分利用多模态数据中潜在的深度信息,其对每个模态下的数据学习到的表征粒度较粗,不能保证其检索的准确性。因此跨模态检索在具体应用中还存在许多问题。同时,以往的跨模态检索模型大多只使用两种模态的数据,这些数据没法很好的刻画现实世界中的信息关联,如何尽可能有效地利用各种相关的多模态数据也是一个有待解决的技术问题。

发明内容

为了克服现有跨模态检索方法对多模态数据利用不充分、对不同模态间的数据表征能力差、检索精度低等不足,本发明提供一种精度高、能充分利用多种模态的数据、表征能力强的基于图卷积神经网络的跨模态检索方法,采用了最新的先进的基于图学习的神经网络技术,不仅可以更有效地提取深度语义特征,还可以挖掘特征在模态中的潜在相关性。因此本方法在端到端的跨模态检索任务中,能够有效地跨越模态之间的语义鸿沟检索出想要的数据。

本发明解决其技术问题所采用的技术方案是:

一种基于图卷积神经网络的跨模态检索方法,所述方法包括以下步骤:

步骤一、网络构建,过程如下:

步骤1.1:该深度学习网络主要框架由一个图像图卷积模型、一个文本图卷积模型及一个典型关联分析模型组成;

步骤1.2:其中图像图卷积模型有图像特征提取模型与图卷积神经网络结合组成,文本图卷积模型由文本特征提取模型与图卷积神经网络结合组成,图像特征提取模型选用预训练的ResNet-101卷积神经网络,文本特征提取模型选用预训练的BERT模型;

步骤1.3:典型关联分析模型的两路输入部分各接一个空间金字塔池化层与一个全连接层,全连接层后面接ReLU激活函数;

步骤1.4:最后连接到典型关联分析范式层,包括典型关联分析函数与损失函数,选用的损失函数为Pairwise排序损失;

步骤二、数据集预处理,过程如下:

步骤2.1:将用于正式训练的多模态数据集包含成对的图像、文本、图像关联数据和文本关联数据三种模态的数据,将该数据集按照对分为训练集Q和测试集Q’两部分;

步骤2.2:对用于提取特征的两个图卷积模型使用多标签分类数据集进行预训练微调参数;

步骤2.3:将预训练好的图卷积模型参数读入跨模态检索模型的对应图卷积模型处;

步骤三、网络训练,过程如下:

步骤3.1:将Q中每个训练样本中的图像与文本作为两路输入送入跨模态检索模型;

步骤3.2:对图像使用卷积神经网络提取图像特征,对文本使用BERT提取文本特征;

步骤3.3:将提取的特征分别采用全局最大池化表征为特征向量,分别送入预训练好的图卷积神经网络进行上采样:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010254505.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top