[发明专利]一种两级网络的图像文本跨媒体检索方法有效

专利信息
申请号: 201910355345.1 申请日: 2019-04-29
公开(公告)号: CN110059217B 公开(公告)日: 2022-11-04
发明(设计)人: 李志欣;凌锋;张灿龙;周韬 申请(专利权)人: 广西师范大学
主分类号: G06F16/583 分类号: G06F16/583;G06F16/58;G06F16/33
代理公司: 桂林市持衡专利商标事务所有限公司 45107 代理人: 陈跃琳
地址: 541004 广西壮*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种两级网络的图像文本跨媒体检索方法,首先通过构建了跨媒体两级网络来探索两级对齐,它分别包含两个用于全局,局部的子网。接着利用训练数据集来对跨媒体两级模型进行训练,以确定跨媒体两级模型中的网络参数,由此得到训练好的跨媒体两级模型。最后,利用该训练好的跨媒体两级模型对待检索图像和待检索文本进行相似度检索。实验表明,本发明在跨媒体检索的应用上达到了不错的效果。
搜索关键词: 一种 两级 网络 图像 文本 媒体 检索 方法
【主权项】:
1.一种两级网络的图像文本跨媒体检索方法,其特征是,包括如下步骤:步骤1、构建跨媒体两级模型阶段:所构建的跨媒体两级模型包括全局生成对抗网络和局部跨媒体注意网络;步骤2、训练数据集的获取阶段:步骤2.1、从现有图像文本跨媒体的数据集中获取原始图像和原始文本,并将所获取原始图像和原始文本中相互对应的1个原始图像和1个原始文本形成图像文本对;步骤2.2、对每个图像文本对中的原始图像和原始文本分别附上不同的模态标签,由此得到训练数据集;步骤3、跨媒体两级模型进行训练阶段:步骤3.1、利用图像文本对跨媒体两级模型中的全局生成对抗网络进行训练;步骤3.1.1、先将图像文本对中的原始图像输入到全局卷积神经网络中进行图像的特征提取训练,再将所提取到的图像的特征送入到全局图像全连接网络中进行降维训练,以训练出该原始图像的图像全局表示;步骤3.1.2、先将图像文本对中的原始文本输入到字符型卷积神经网络中进行文本的特征提取训练,再将所提取到的文本的特征送入全局长期短期记忆网络学习其全局代表性,后将学习后的文本的特征送入到全局文本全连接网络中进行降维训练,以训练出该原始文本的文本全局表示;步骤3.1.3、利用每个图像文本对中的原始图像训练所得的图像全局表示和原始文本训练所得的文本全局表示,去训练全局生成对抗网络的全局特征相似度;步骤3.2、利用图像文本对跨媒体两级模型中的局部跨媒体注意网络进行训练;步骤3.2.1、先将图像文本对中的原始图像输入快速候选区域卷积神经网络中进行图像候选区域提取训练,再将所提取到的图像候选区域送入到局部卷积神经网络中进行图像候选区域的特征提取训练,后将所提取到的图像候选区域的特征送入到局部图像全连接网络中进行降维训练,以训练出该原始图像的图像局部表示;步骤3.2.2、先将图像文本对中的原始文本输入到词嵌入矩阵进行单词提取训练,再将所提取到的单词向量送入文本双向长期短期记忆网络总结出所提取单词向量的语义信息,以生成不同的文本片段,并对生成的文本片段进行注意机制训练来捕获其中有用的文本片段,后将有用的文本片段送入到局部文本全连接网络中进行降维训练,以训练出该原始文本的文本局部表示;步骤3.2.3、利用每个图像文本对中的原始图像训练所得的图像局部表示和原始文本训练所得的文本局部表示,去训练局部跨媒体注意网络的局部特征相似度;步骤3.3、利用步骤3.1训练所得全局生成对抗网络的全局特征相似度和步骤3.2训练所得训练局部跨媒体注意网络的局部特征相似度,去训练跨媒体两级模型的综合相似度;步骤3.4、利用步骤2所得到的训练数据集中的所有图像文本对对步骤1所构建的跨媒体两级模型进行重复步骤3.1‑3.3的训练过程,以确定跨媒体两级模型中的网络参数,由此得到训练好的跨媒体两级模型;步骤4、检索阶段:将待检索图像和待检索文本同时输入到步骤3所训练好的跨媒体两级模型中,通过训练好的跨媒体两级模型输出待检索图像和待检索文本之间的综合相似度,从而确定该待检索图像和待检索文本是否相似。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910355345.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top