[发明专利]一种基于图像背景掩膜的目标候选区域提取方法有效

专利信息
申请号: 201810325376.8 申请日: 2018-04-12
公开(公告)号: CN108648197B 公开(公告)日: 2021-09-07
发明(设计)人: 侯春萍;莫晓蕾;杨阳;管岱;夏晗 申请(专利权)人: 天津大学
主分类号: G06T7/11 分类号: G06T7/11;G06K9/34;G06N3/04;G06N3/08
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于图像背景掩膜的目标候选区域提取方法,包括下列步骤:(1)构建图像背景掩模数据集;(2)搭建GAN模型,采用训练GAN的方式为图像增加背景掩膜;(3)定义损失函数:为在处理图像中高频的结构信息细节部分的同时,使生成的图片和训练的目标图片尽量相似,将损失函数定义为GAN的目标函数与合成图像的一范数距离损失的结合;(4)模型训练。
搜索关键词: 一种 基于 图像 背景 目标 候选 区域 提取 方法
【主权项】:
1.一种基于图像背景掩膜的目标候选区域提取方法,包括下列步骤:(1)构建图像背景掩模数据集选取原始图像及一一对应的标签构建图像背景掩模数据集,标签指明了所有物体的位置,将一一对应的原始图像与灰度掩膜图像或黑色掩膜图像水平拼接成一张图片,并将数据集分为含训练图像对的训练集和含测试图像对的测试集;(2)搭建GAN模型,采用训练GAN的方式为图像增加背景掩膜GAN模型由生成模型和判别模型组成,构建生成模型使其学习到从输入图像以及随机噪声向量到输出图像的映射,判别模型通过鉴别其输入是否为真正的图像即非生成图来约束生成器,使生成模型的输出结果更接近所需的背景掩模图像;生成模型采用全卷积结构,整个网络由包含八层的编码器和包含八层的解码器组成,采用编码器‑解码器架构,编码模块与解码模块的对应层之间加入了跳跃链接,使得对应的特征图能够按通道连接起来,在多次下采样过程中保留不同分辨率下像素级的细节信息;采用分块判别器的结构,具有不同大小的感受野,以提升生成图像高频部分的质量,最后一层的卷积层使用Sigmoid函数,其特征图被映射到一个一维的输出,表示背景掩模图像正确的概率;(3)定义损失函数为在处理图像中高频的结构信息细节部分的同时,使生成的图片和训练的目标图片尽量相似,将损失函数定义为GAN的目标函数与合成图像的一范数距离损失的结合;(4)模型训练将步骤(1)中得到的训练集,每次随机选择一副图像对,即原始图像与基于标签的背景掩模图像的图像对,送入网络进行训练,首先固定生成模型,更新判别模型的网络权重,然后固定判别模型,将判别模型的判别结果回传至生成模型,更新生成模型的权重,如此反复,固定一方更行另一方的权重交替迭代,直到双方达到一个动态平衡,此时判别模型无法区分出哪一张是生成模型产生的合成图,可以认为生成模型产生了足够近似标签的背景掩模图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810325376.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top