[发明专利]一种基于图像背景掩膜的目标候选区域提取方法有效
申请号: | 201810325376.8 | 申请日: | 2018-04-12 |
公开(公告)号: | CN108648197B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 侯春萍;莫晓蕾;杨阳;管岱;夏晗 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 背景 目标 候选 区域 提取 方法 | ||
1.一种基于图像背景掩膜的目标候选区域提取方法,包括下列步骤:
(1)构建图像背景掩模数据集
选取原始图像及一一对应的标签构建图像背景掩模数据集,标签指明了所有物体的位置,将一一对应的原始图像与灰度掩膜图像或黑色掩膜图像水平拼接成一张图片,并将数据集分为含训练图像对的训练集和含测试图像对的测试集;
(2)搭建GAN模型,采用训练GAN的方式为图像增加背景掩膜
GAN模型由生成模型和判别模型组成,构建生成模型使其学习到从输入图像以及随机噪声向量到输出图像的映射,判别模型通过鉴别其输入是否为真正的图像即非生成图来约束生成器,使生成模型的输出结果更接近所需的背景掩模图像;生成模型采用全卷积结构,整个网络由包含八层的编码器和包含八层的解码器组成,采用编码器-解码器架构,编码模块与解码模块的对应层之间加入了跳跃链接,使得对应的特征图能够按通道连接起来,在多次下采样过程中保留不同分辨率下像素级的细节信息;采用分块判别器的结构,具有不同大小的感受野,以提升生成图像高频部分的质量,最后一层的卷积层使用Sigmoid函数,其特征图被映射到一个一维的输出,表示背景掩模图像正确的概率;
(3)定义损失函数
为在处理图像中高频的结构信息细节部分的同时,使生成的图片和训练的目标图片尽量相似,将损失函数定义为GAN的目标函数与合成图像的一范数距离损失的结合;
(4)模型训练
将步骤(1)中得到的训练集,每次随机选择一副图像对,即原始图像与基于标签的背景掩模图像的图像对,送入网络进行训练,首先固定生成模型,更新判别模型的网络权重,然后固定判别模型,将判别模型的判别结果回传至生成模型,更新生成模型的权重,如此反复,固定一方更行另一方的权重交替迭代,直到双方达到一个动态平衡,此时判别模型无法区分出哪一张是生成模型产生的合成图,可以认为生成模型产生了足够近似标签的背景掩模图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810325376.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序