[发明专利]一种两级网络的图像文本跨媒体检索方法有效
申请号: | 201910355345.1 | 申请日: | 2019-04-29 |
公开(公告)号: | CN110059217B | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 李志欣;凌锋;张灿龙;周韬 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/33 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种两级网络的图像文本跨媒体检索方法,首先通过构建了跨媒体两级网络来探索两级对齐,它分别包含两个用于全局,局部的子网。接着利用训练数据集来对跨媒体两级模型进行训练,以确定跨媒体两级模型中的网络参数,由此得到训练好的跨媒体两级模型。最后,利用该训练好的跨媒体两级模型对待检索图像和待检索文本进行相似度检索。实验表明,本发明在跨媒体检索的应用上达到了不错的效果。 | ||
搜索关键词: | 一种 两级 网络 图像 文本 媒体 检索 方法 | ||
【主权项】:
1.一种两级网络的图像文本跨媒体检索方法,其特征是,包括如下步骤:步骤1、构建跨媒体两级模型阶段:所构建的跨媒体两级模型包括全局生成对抗网络和局部跨媒体注意网络;步骤2、训练数据集的获取阶段:步骤2.1、从现有图像文本跨媒体的数据集中获取原始图像和原始文本,并将所获取原始图像和原始文本中相互对应的1个原始图像和1个原始文本形成图像文本对;步骤2.2、对每个图像文本对中的原始图像和原始文本分别附上不同的模态标签,由此得到训练数据集;步骤3、跨媒体两级模型进行训练阶段:步骤3.1、利用图像文本对跨媒体两级模型中的全局生成对抗网络进行训练;步骤3.1.1、先将图像文本对中的原始图像输入到全局卷积神经网络中进行图像的特征提取训练,再将所提取到的图像的特征送入到全局图像全连接网络中进行降维训练,以训练出该原始图像的图像全局表示;步骤3.1.2、先将图像文本对中的原始文本输入到字符型卷积神经网络中进行文本的特征提取训练,再将所提取到的文本的特征送入全局长期短期记忆网络学习其全局代表性,后将学习后的文本的特征送入到全局文本全连接网络中进行降维训练,以训练出该原始文本的文本全局表示;步骤3.1.3、利用每个图像文本对中的原始图像训练所得的图像全局表示和原始文本训练所得的文本全局表示,去训练全局生成对抗网络的全局特征相似度;步骤3.2、利用图像文本对跨媒体两级模型中的局部跨媒体注意网络进行训练;步骤3.2.1、先将图像文本对中的原始图像输入快速候选区域卷积神经网络中进行图像候选区域提取训练,再将所提取到的图像候选区域送入到局部卷积神经网络中进行图像候选区域的特征提取训练,后将所提取到的图像候选区域的特征送入到局部图像全连接网络中进行降维训练,以训练出该原始图像的图像局部表示;步骤3.2.2、先将图像文本对中的原始文本输入到词嵌入矩阵进行单词提取训练,再将所提取到的单词向量送入文本双向长期短期记忆网络总结出所提取单词向量的语义信息,以生成不同的文本片段,并对生成的文本片段进行注意机制训练来捕获其中有用的文本片段,后将有用的文本片段送入到局部文本全连接网络中进行降维训练,以训练出该原始文本的文本局部表示;步骤3.2.3、利用每个图像文本对中的原始图像训练所得的图像局部表示和原始文本训练所得的文本局部表示,去训练局部跨媒体注意网络的局部特征相似度;步骤3.3、利用步骤3.1训练所得全局生成对抗网络的全局特征相似度和步骤3.2训练所得训练局部跨媒体注意网络的局部特征相似度,去训练跨媒体两级模型的综合相似度;步骤3.4、利用步骤2所得到的训练数据集中的所有图像文本对对步骤1所构建的跨媒体两级模型进行重复步骤3.1‑3.3的训练过程,以确定跨媒体两级模型中的网络参数,由此得到训练好的跨媒体两级模型;步骤4、检索阶段:将待检索图像和待检索文本同时输入到步骤3所训练好的跨媒体两级模型中,通过训练好的跨媒体两级模型输出待检索图像和待检索文本之间的综合相似度,从而确定该待检索图像和待检索文本是否相似。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910355345.1/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序