[发明专利]基于生成对抗性自动增强网络的图像检索方法及装置在审
申请号: | 202111066975.0 | 申请日: | 2021-09-13 |
公开(公告)号: | CN113836330A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 方文璇;张凯 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/583;G06F16/55;G06N3/04;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗性 自动 增强 网络 图像 检索 方法 装置 | ||
1.基于生成对抗性自动增强网络的图像检索方法,其特征在于,包括如下步骤:
S1、对公开数据集的街景图像进行预处理;
S2、对预处理后的街景图像进行划分为训练集街景图像、测试集街景图像和验证集街景图像;
S3、搭建生成包含增强策略网络和目标检索网络的生成对抗性自动增强网络;
S4、将训练集中的街景图像作为输入特征输入生成对抗性自动增强网络,由增强策略网络生成不同的策略,并把这些策略作用于相同的数据上,对数据集中一批大小的图像数据进行策略中的增强处理,得到增强后的数据,然后由目标检索网络,通过学习更多的特征来最小化损失,并更新权重,同时将这些损失收集起来作为反馈更新增强策略网络来最大化损失,得到新的增强策略,并迭代进行;
S5、将测试集街景图像和验证集街景图像输入至训练与确定好模型参数的生成对抗性自动增强网络,进行测试和验证得到最终检索结果。
2.根据权利要求1所述的基于生成对抗性自动增强网络的图像检索方法,其特征在于,步骤S1包括如下步骤:
S1-1、获取公开数据集的街景图像;
S1-2、将公开数据集的街景图像的眼底图像进行裁剪,裁剪成统一的分辨率图像;
S1-3、对统一分辨率的图像进行亮度、对比度、饱和度和色调处理,然后进行归一化操作。
3.根据权利要求1所述的基于生成对抗性自动增强网络的图像检索方法,其特征在于,步骤S2中划分为训练集街景图像时,训练集中的每组街景图像包括一个查询图像、一个最简单的正图像、前n个困难的正图像和负图像。
4.根据权利要求1所述的基于生成对抗性自动增强网络的图像检索方法,其特征在于,步骤S4中包括将输入生成对抗性自动增强网络的训练集街景图像特征进行若干代模型训练,具体包括如下步骤:
S4-1、将第一代模型的输出作为第二代模型的监督,第一代模型通过与相同算法的方案进行训练;
S4-2、训练收敛后,建立并初始化第二代模型:
S4-3、并使用固定的第一代模型进行相似度标签的估计,用以训练第二代模型,以此循环。
5.根据权利要求1所述的基于生成对抗性自动增强网络的图像检索方法,其特征在于,在增强策略网络的搜索空间中,一个增强策略被定义为由m个子策略组成,一个子策略包含两个要依次应用的图像操作,每个操作都是一个图像处理函数,有两个对应的参数,以及应用这个操作的概率和幅度,然后将每个最佳策略连接起来形成一个包含m×m个子策略的单个策略。
6.根据权利要求5所述的基于生成对抗性自动增强网络的图像检索方法,其特征在于,对所有操作的幅度都设置在预设的范围值内。
7.一种基于生成对抗性自动增强网络的图像检索装置,其特征在于,包括:包括至少一个存储器以及至少一个处理器;
所述存储器,包括存储于其中的至少一个可执行程序;
所述可执行程序在由所述处理器执行时,实现如权利要求1至6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111066975.0/1.html,转载请声明来源钻瓜专利网。